Está en la página 1de 726

CONTROL AUTOMTICO

El Centro de Innovacin y Desarrollo Tecnolgico en Cmputo del Instituto Politcnico Nacional,


presenta un libro cuyo objetivo es el de contribuir hacia la reduccin de la brecha existente entre la
teora y la prctica en la enseanza del Control Automtico. Por esta razn, aunque el contenido del
CONTROL AUTOMTICO
libro es de nivel Licenciatura puede ser de gran utilidad incluso para aquellas personas involucradas Teora de diseo, construccin de prototipos,
en el proceso enseanza-aprendizaje del Control Automtico en el nivel de Posgrado.
modelado, identificacin y pruebas experimentales
La caracterstica principal de esta obra es que se describe de manera detallada cmo disear, construir
y probar experimentalmente varios sistemas de control. Para ello, primero se describe la tarea que
debe realizar el sistema de control bajo estudio y se obtiene su modelo matemtico. Luego, se explica
de manera detallada cmo construir el prototipo experimental y cmo estimar los valores numricos
de los parmetros del modelo obtenido previamente (identificacin experimental del modelo).
Entonces se disea el controlador correspondiente utilizando la teora presentada en los primeros
captulos de la obra. Finalmente, se muestra cmo construir el controlador diseado previamente
utilizando electrnica analgica o digital y se presentan los resultados obtenidos experimentalmente.

El libro es especialmente til para estudiantes y profesores en las carreras de Ingeniera Elctrica,
Electrnica, Mecnica, Mecatrnica e incluso Robtica.
Victor Manuel Hernndez Guzmn
Ramn Silva Ortigoza
Roberto Valentn Carrillo Serrano

Victor Manuel Hernndez Guzmn

Roberto Valentn Carrillo Serrano


Ramn Silva Ortigoza

Instituto Politcnico Nacional

COLECCIN CIDETEC
Roberto Valentn Carrillo Serrano. Naci
Victor Manuel Hernndez Guzmn. Naci
en Quertaro, Qro., Mxico en 1976. Recibi
en Quertaro, Qro., Mxico. Recibi el ttulo
el ttulo de Ingeniero en Instrumentacin y
de Ingeniero Industrial en Elctrica por parte
Control de Procesos por la Universidad
del Instituto Tecnolgico de Quertaro en
Autnoma de Quertaro, donde tambin
1988, el grado de Maestro en Ciencias en
obtuvo los grados de Maestro en Ciencias en
Ingeniera Elctrica (Control) por parte del
Instrumentacin y Control Automtico, y de
Instituto Tecnolgico de la Laguna, en
Doctor en Ingeniera en 2000, 2008 y 2011
Torren, Coah., en 1991 y el grado de Doctor
respectivamente. Trabaj en Kellogg de
en Ciencias en Ingeniera Elctrica
Mxico de 1999 a 2006. Las reas de inters del
(Mecatrnica) por parte del CINVESTAV-
Dr. Carrillo Serrano son los robots
IPN, en Mxico, D.F., en 2003. Actualmente
manipuladores, control de mquinas elctricas
es Profesor en los programas de Licenciatura y
y control de sistemas mecatrnicos.
Maestra en Instrumentacin y Control de la
Actualmente es Profesor en el programa de
Universidad Autnoma de Quertaro. Su
Licenciatura en Ingeniera en Automatizacin
trabajo de investigacin trata sobre el control
y de la Maestra en Instrumentacin y Control
de robots manipuladores y sistemas electro-
Automtico de la Universidad Autnoma de
mecnicos. Tiene particular inters en la
Quertaro, adems de ser miembro del
construccin de prototipos didcticos para la
Sistema Nacional de Investigadores, Mxico.
enseanza de tcnicas de control clsicas y
En cuanto a publicaciones se refiere, estas se
modernas (no lineales).
encuentran en estndares internacionales que
pertenecen a la base de datos Journal Citation
Reports (JCR) e ISI-Thomson.

Ramn Silva Ortigoza. Recibi el ttulo de


Licenciado en Electrnica por la Benemrita
Universidad Autnoma de Puebla en 1999, y
los grados de Maestro y Doctor en Ciencias en
Ingeniera Elctrica (Opcin Mecatrnica)
por el CINVESTAV-IPN, en 2002 y 2006,
respectivamente. Actualmente, es
Investigador del Departamento de Posgrado
del rea de Mecatrnica en el CIDETEC del
Instituto Politcnico Nacional, y miembro del
Sistema Nacional de Investigadores. Es
coautor del libro Control Design Techniques
in Power Electronics Devices (Springer-
Verlag, London, 2006), y coeditor del libro
Mecatrnica (Coleccin CIDETEC,
Mxico, 2010). Se ha desempeado como
jurado en el Premio de Ingeniera de la
Ciudad de Mxico y Premio a la
Investigacin en el IPN , as como Evaluador
de Programas de Posgrado presentados en el
marco del PNPC de CONACYT . Sus reas
de inters incluyen el control de sistemas
mecatrnicos, la robtica mvil y el control
aplicado a electrnica de potencia.
Victor Manuel Hernandez Guzman
Ramon Silva Ortigoza
Roberto Valentn Carrillo Serrano

CONTROL AUTOMATICO

Teora de diseno, construccion de prototipos,


modelado, identificacion y pruebas
experimentales

Mexico, D.F. Enero 2013.


Control Automatico
Teora de diseno, construccion de prototipos,
modelado, identificacion y pruebas experimentales

Autores:
Victor Manuel Hernandez Guzman
Ramon Silva Ortigoza
Roberto Valentn Carrillo Serrano

Primera Edicion 2013


D.R. c 2013
Instituto Politecnico Nacional
Luis Enrique Erro s/n.
Unidad Profesional Adolfo Lopez Mateos
Zacatenco, 07738, Mexico, D.F.

CIDETEC
Av. Juan de Dios Batiz S.N. esq. Miguel Othon de Mendizabal
Col. Nueva Industrial Vallejo
Del. Gustavo A. Madero C.P. 07700

ISBN: 978-607-414-362-1
Hecho en Mexico / Made in Mexico
V

A mi esposa, padres y hermanos.


Victor.

Para mis maravillosos hijos, Rhomina y Joserhamon, y a mi madre.


Ramon.

A Dios, a mis padres, a mi esposa, a mis profesores y alumnos.


Roberto.
Prefacio

El Control Automatico es una de las disciplinas que soporta de manera


importante el tecnologicamente avanzado modo de vida que conocemos hoy
en da. Sus aplicaciones se encuentran en casi todas las actividades que el
ser humano realiza en el siglo XXI: desde el funcionamiento del telescopio
espacial Hubble y de numerosas naves espaciales hasta el refrigerador que se
encuentra en los hogares asegurando la conservacion de los alimentos. Desde
los depositos de agua residenciales hasta las grandes industrias que producen
todos los satisfactores de los seres humanos: automoviles, aviones, alimentos,
bebidas y medicinas, por mencionar algunos.
Aunque se sabe que las primeras aplicaciones del Control Automatico apa-
recieron hace mas de 2000 anos, fue la Revolucion Industrial la que detono su
desarrollo como un conjunto de conocimientos cientficos destinados a resol-
ver problemas tecnologicos. Desde entonces, el uso del Control Automatico
ha sido fundamental para que las actividades productivas del ser humano se
hagan cada vez mas eficaces incrementando la calidad y la repetitibilidad de
los productos.
Por esta razon, los cursos sobre Control Automatico se han hecho comunes
en las carreras de Ingeniera Electrica, Electronica, Mecanica, Qumica y, mas
recientemente, Mecatronica y Robotica. Sin embargo, el hecho de que las tecni-
cas de Control Automatico convencionales esten soportadas por herramientas
matematicas ha planteado tradicionalmente una dificultad en la ensenanza de
esta disciplina: para aprender a disenar sistemas de control primero se debe
tener un buen conocimiento de como se resuelven las ecuaciones diferencia-
les lineales de coeficientes constantes mediante el uso de la transformada de
Laplace. Este hecho plantea un importante obstaculo dado que la solucion
de ecuaciones diferenciales es algo que normalmente es complicado para la
mayora de los estudiantes de Licenciatura. El problema se complica mas aun
porque en Control Automatico lo mas importante de resolver una ecuacion di-
ferencial es saber interpretar el resultado cuando la mayora de los estudiantes
de Licenciatura se quedan perdidos en como resolver la ecuacion diferencial.
VIII Prefacio

Otra dificultad en la ensenanza del Control Automatico es como mostrar


la manera de relacionar los resultados matematicos con los aspectos practicos
de un sistema de control: Como construir practicamente un controlador que
esta expresado en terminos de la variable de Laplace (funcion de transferen-
cia)? Como se construye un controlador usando electronica digital o usando
electronica analogica? Como tomar en cuenta las ganancias de los sensores y
de los amplificadores de potencia? Como determinar esta ganancia en un am-
plificador de potencia basado en modulacion por ancho de pulso? Que efectos
tienen estas ganancias en un sistema de control?
La manera en que tradicionalmente se ha resuelto el problema de la practi-
ca descrito en el parrafo anterior ha sido la compra de prototipos didacticos
comerciales. Sin embargo, esto tiene dos desventajas: 1) estos equipos nor-
malmente son excesivamente caros pues son construidos en el extranjero y 2)
muchos de los aspectos involucrados en el funcionamiento de un sistema de
control permanecen invisibles para el estudiante; esto es debido a que estos
equipos estan disenados pensando que el estudiante de Control Automatico no
tiene porque saber como se resuelven los detalles practicos relacionados con la
electronica y la programacion, por ejemplo, de los diferentes componentes de
un sistema de control. Este es el caso de Como construir un amplificador de
potencia? Como disenar y construir un controlador basado en amplificado-
res operacionales o un controlador basado en un microcontrolador? Existen
alternativas a la practica comun de comprar sensores en el extranjero?
La presente obra pone a la disposicion de los estudiantes y de los profeso-
res de nivel Licenciatura un material con el cual se pretende ayudar a resolver
algunas de las dificultades arriba mencionadas. Con el fin de facilitar el apren-
dizaje de los aspectos teoricos se incluye un captulo dedicado exclusivamente
a la solucion de ecuaciones diferenciales lineales y de coeficientes constantes
usando la transformada de Laplace. Si bien ese captulo puede ser visto como
un curso de ecuaciones diferenciales, la principal diferencia respecto del curso
de matematicas que sobre este tema se lleva en el tronco comun de Licencia-
tura (Ingeniera) es que en nuestro libro se hace enfasis en la interpretacion
de la solucion de una ecuacion diferencial. Ademas se resalta el efecto que
tienen los parametros de una ecuacion diferencial en la forma grafica de la
solucion. Debemos subrayar que la experiencia de los autores es que los libros
existentes sobre Control Automatico (incluso los mas importantes) se limitan
a presentar un breve prontuario de soluciones de ecuaciones diferenciales y
no consiguen que el estudiante razone acerca de lo que esta haciendo. Para
salvar este problema, en el presente libro se recurre a ejemplificar cada tipo
de ecuacion diferencial con una situacion practica que cualquier estudiante de
Licenciatura ha observado en algun momento de su vida. Es decir, se recurre
a la experiencia cotidiana del estudiante para que comprenda lo que significan
los resultados matematicos.
La problematica relacionada con los aspectos practicos de los sistemas de
control es resuelta mediante la aplicacion a varios sistemas de control experi-
mentales. En cada uno de estos ejemplos se procede de igual manera. Primero
Prefacio IX

se describe la tarea que ejecuta el sistema de control bajo estudio y luego


se explica al lector como construir cada uno de los componentes de dicho
sistema de control. Posteriormente se muestra como obtener el modelo ma-
tematico correspondiente para despues explicar a detalle como obtener, de
manera experimental, el valor numerico de cada uno de los parametros del
modelo. Entonces se usan las tecnicas de control presentadas previamente en
los primeros captulos del libro para disenar (matematicamente) el controlador
correspondiente. Se presenta tambien la manera de construir el controlador
usando electronica analogica o digital y finalmente se presentan los resultados
experimentales obtenidos al controlar el prototipo que se ha construido.
A continuacion se explica como esta organizada la presente obra. En el
captulo 1 se presenta una panoramica general del Control Automatico con el
fin de que el lector entienda a grandes rasgos cual es el objetivo de disenar
sistemas de control. Esto se realiza utilizando un ejemplo que cuyo funciona-
miento es bien conocido por la mayora de las personas: el control de un canon
antiaereo. Tambien se presenta una breve historia del Control Automatico y se
relaciona con el contenido de la obra para que el lector identifique cuales son
las razones por las que cada herramienta de control ha sido desarrollada. En el
captulo 2 se aborda el problema de obtener el modelo matematico de sistemas
fsicos comunes en Ingeniera Electrica, Electronica, Mecanica y Mecatronica.
Una razon importante de incluir este tema es que el lector se de cuenta de que
los sistemas de control estan descritos por ecuaciones diferenciales lineales y
de coeficientes constantes. Esto motiva el estudio de la solucion de las ecuacio-
nes diferenciales en el captulo 3, pues esto es importante para entender como
responde un sistema de control y que hay que modificar en el para conseguir
la respuesta deseada.
En los captulos 4 al 7 se presentan las herramientas utilizadas en el diseno
de sistemas de control clasico y moderno: criterios de estabilidad y error en
estado estacionario (captulo 4), la tecnica del lugar de las races (captulo 5),
la tecnica de la respuesta en frecuencia (captulo 6) y la tecnica de las variables
de estado (captulo 7). La exposicion de estos temas esta dirigida hacia su
aplicacion en los ejemplos practicos presentados en los ultimos captulos de
la obra. De este modo, muchos de los ejemplos presentados en los primeros
captulos tratan sobre el diseno de controladores que despues seran construidos
y probados experimentalmente en los ultimos captulos.
La estructura de los captulos 8 al 14 es la misma, pues tienen el mismo
objetivo: se presenta la aplicacion de las tecnicas de control desarrolladas
en los captulos 4 al 7 al analisis y diseno de sistemas de control practicos.
Los controladores correspondientes son construidos al igual que el sistema
de control completo, utilizando materiales de bajo costo y que son faciles
de conseguir por un estudiante de licenciatura. Finalmente, se presentan los
resultados obtenidos experimentalmente al probar los sistemas de control en
la practica.
En el captulo 8 se estudian y disenan varios circuitos electronicos realimen-
tados, entre ellos algunos circuitos osciladores con forma de onda sinusoidal
X Prefacio

basados en amplificadores operacionales (audiofrecuencia) y en transistores


(radiofrecuencia). En los captulos 9 y 10 se controla la velocidad y la posi-
cion, respectivamente, de un motor de corriente directa con escobillas e imanes
permanentes. Un sistema de levitacion magnetica es controlado en el captulo
11 mientras que en el captulo 12 se controla un mecanismo muy popular en
Control Automatico y que es conocido como Ball and Beam. Finalmente, en
los captulos 13 y 14 se presentan dos mecanismos que incluyen pendulos: el
pendulo de Furuta y el pendulo con rueda inercial. Por ultimo, se debe decir
que la importancia de todos estos prototipos experimentales es reconocida en
los cursos de control en todo el mundo y por eso han sido seleccionados como
bancos de prueba en la presente obra.
El primer autor reconoce y agradece el apoyo de sus dos coautores. Su
colaboracion ha sido de gran valor no solo en la elaboracion de la presente obra
sino, ademas, en diversas actividades de investigacion que han realizado desde
que eran estudiantes de Doctorado (con el segundo autor) y desde que el tercer
autor realizo sus estudios de Maestra y Doctorado, los cuales el primer autor
tuvo la fortuna de dirigir. Un reconocimiento y un agradecimiento especial
para los Drs. Hebertt Sira Ramrez (Director de tesis) y Gerardo Silva Navarro,
ambos investigadores del CINVESTAV-IPN quienes fueron fundamentales en
los estudios de Doctorado del primer autor. Tambien se reconoce y agradece
al Dr. Vctor Santibanez del Instituto Tecnologico de la Laguna con quien
el primer autor ha mantenido una importante colaboracion cientfica desde
2004 en el area de control de robots manipuladores. Un reconocimiento a
la importante colaboracion cientfica con los Drs. Ricardo Campa (Instituto
Tecnologico de la Laguna) y Arturo Zavala Ro (IPICYT).
Las ideas que han motivado este trabajo tomaron forma durante los cursos
que sobre Control Automatico ha impartido el primer autor a nivel Licencia-
tura y Maestra en la Facultad de Ingeniera de la Universidad Autonoma de
Queretaro, Institucion a la que esta adscrito desde 1995. Se agradece a es-
ta Institucion el apoyo recibido durante todos estos anos. Un agradecimiento
al Sistema Nacional de Investigadores por el apoyo economico recibido des-
de 2005 y al CIDETEC del Instituto Politecnico Nacional por facilitar los
medios editoriales requeridos para la impresion de este libro. Una mencion es-
pecial para mi esposa Judith de quien siempre he recibido el apoyo necesario
para realizar no solo esta obra sino todo el trabajo de investigacion que he
desarrollado desde que decid hacer mis estudios de Doctorado.
El segundo autor reconoce y agradece la invitacion del primer autor para
participar en la elaboracion de este y otros proyectos ambiciosos, academicos
y de investigacion. Su apoyo ha sido fundamental en el desarrollo profesio-
nal del segundo autor y en la formacion conjunta de estudiantes de nivel
maestra. El segundo autor agradece de forma muy especial a los Doctores
Gilberto Silva Ortigoza y Hebertt Sira Ramrez, investigadores de la BUAP
y del CINVESTAV-IPN, por ser sus mentores; el primero a lo largo de toda
su trayectoria y el segundo en sus estudios de formacion de posgrado. Tam-
bien, se reconoce y agradece la importante colaboracion academica con las
Prefacio XI

Doctoras Magdalena Marciano Melchor (CIDETEC-IPN), Griselda Saldana


Gonzalez (Universidad Tecnologica de Puebla) y Mariana Marcelino Aran-
da (UPIICSA-IPN). El segundo autor agradece el apoyo recibido por parte
del CIDETEC del Instituto Politecnico Nacional, Centro de Investigacion al
que esta adscrito desde 2006, el soporte economico recibido de la SIP y de
los programas EDI y COFAA del Instituto Politecnico Nacional, as como del
Sistema Nacional de Investigadores. Mencion especial merecen mis hijos, Rho-
mina y Joserhamon, por su apoyo moral y ser la inspiracion que me permite
esforzarme cada da para dar siempre lo mejor.
El tercer autor agradece primeramente al Dr. V. M. Hernandez Guzman la
atenta invitacion a participar en la realizacion de la presente obra. Al Consejo
Nacional de Ciencia y Tecnologa que me beco para mis estudios de Maestra y
Doctorado (perodo de realizacion de la presente obra). A mi segunda casa, la
Universidad Autonoma de Queretaro, espacio para la docencia, investigacion
y difusion de la cultura que me ha ensenado a ser un mejor ser humano,
manteniendome da con da en constante superacion en todos los sentidos. A
Dios, a mis padres Valentn y Alicia, y a mi esposa Lizbeth, por el apoyo
recibido en todo momento.

V. M. Hernandez Guzman Queretaro, Qro., FI-UAQ.


R. Silva Ortigoza Mexico, D.F., Instituto Politecnico Nacional.
R. V. Carrillo Serrano Queretaro, Qro., FI-UAQ.

Enero de 2013.
Indice general

1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1. Sistema de control de un canon antiaereo . . . . . . . . . . . . . . . . . . . 2
1.2. Historia del Control Automatico . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3. Prototipos didacticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.5. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2. Modelado matematico de sistemas fsicos . . . . . . . . . . . . . . . . . . 15


2.1. Energa y variables generalizadas del sistema . . . . . . . . . . . . . . . . 16
2.2. Almacenadores de energa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.1. Sistemas mecanicos traslacionales . . . . . . . . . . . . . . . . . . . . 20
2.2.2. Sistemas mecanicos rotativos . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.3. Sistemas electricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3. Disipadores de energa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.1. Sistemas mecanicos traslacionales . . . . . . . . . . . . . . . . . . . . 27
2.3.2. Sistemas mecanicos rotativos . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3.3. Sistemas electricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4. Fuentes de energa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4.1. Sistemas mecanicos traslacionales . . . . . . . . . . . . . . . . . . . . 31
2.4.2. Sistemas mecanicos rotativos . . . . . . . . . . . . . . . . . . . . . . . . 31
2.4.3. Sistemas electricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.5. Convertidores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5.1. Transformadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5.2. Adaptadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.6. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.7. Caso de estudio. Un convertidor electronico de potencia de
CD a CD tipo resonante serie de alta frecuencia . . . . . . . . . . . . . 83
2.8. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
2.9. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
XIV Indice general

2.10. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

3. Base matematica: ecuaciones diferenciales . . . . . . . . . . . . . . . . . 97


3.1. Ecuacion diferencial de primer orden . . . . . . . . . . . . . . . . . . . . . . . 99
3.2. Un integrador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
3.3. Ecuacion diferencial de segundo orden . . . . . . . . . . . . . . . . . . . . . . 112
3.4. Races reales diferentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
3.5. Races reales repetidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
3.6. Races complejas conjugadas diferentes . . . . . . . . . . . . . . . . . . . . . 134
3.7. Races complejas conjugadas repetidas . . . . . . . . . . . . . . . . . . . . . 140
3.8. Una ecuacion diferencial general . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
3.9. Polos y ceros en sistemas de orden superior . . . . . . . . . . . . . . . . . 150
3.9.1. Cancelacion polo-cero y modelos reducidos . . . . . . . . . . . 150
3.9.2. Polos dominantes y modelos reducidos . . . . . . . . . . . . . . . 152
3.10. El principio de superposicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
3.11. Caso de estudio. Un convertidor electronico de potencia de
CD a CD tipo resonante serie de alta frecuencia . . . . . . . . . . . . . 160
3.12. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
3.13. Preguntas de Repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
3.14. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175

4. Criterios de estabilidad y error en estado estacionario . . . . . 177


4.1. Diagramas de bloques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
4.2. Regla de los signos para determinar la ubicacion de las races
de un polinomio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
4.2.1. Polinomios de segundo grado . . . . . . . . . . . . . . . . . . . . . . . 187
4.2.2. Polinomios de primer grado . . . . . . . . . . . . . . . . . . . . . . . . . 190
4.2.3. Polinomios de grado 3 o mayor . . . . . . . . . . . . . . . . . . . . . . 190
4.3. Criterio de estabilidad de Routh . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
4.4. Error en estado estacionario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
4.4.1. Referencia tipo escalon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
4.4.2. Referencia tipo rampa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
4.4.3. Referencia tipo parabola . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
4.5. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
4.6. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
4.7. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
Indice general XV

5. Diseno usando la respuesta en el tiempo . . . . . . . . . . . . . . . . . . . 221


5.1. Diseno con el lugar de las races . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
5.1.1. Reglas para construir el lugar de las races. . . . . . . . . . . . 225
5.2. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
5.2.1. Control proporcional de posicion . . . . . . . . . . . . . . . . . . . . 232
5.2.2. Control proporcional-derivativo (PD) de posicion . . . . . . 235
5.2.3. Control de posicion usando un compensador de adelanto238
5.2.4. Control proporcional-integral (PI) de velocidad . . . . . . . . 241
5.2.5. Control proporcional-integral-derivativo (PID) de
posicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
5.2.6. Asignacion de los polos de lazo cerrado deseados . . . . . . 257
5.2.7. Control proporcional-integral-derivativo (PID) de un
sistema de levitacion magnetica . . . . . . . . . . . . . . . . . . . . . 264
5.2.8. Control de un sistema ball and beam . . . . . . . . . . . . . . . . 268
5.3. Caso de estudio. Notas adicionales sobre el control PID de
posicion de un motor de CD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275
5.4. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
5.5. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
5.6. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289

6. Diseno usando la respuesta en frecuencia . . . . . . . . . . . . . . . . . . 291


6.1. Un circuito RC de corriente alterna . . . . . . . . . . . . . . . . . . . . . . . . 292
6.1.1. Representaciones graficas comunes . . . . . . . . . . . . . . . . . . . 294
6.1.2. Modelo matematico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
6.1.3. Componentes de frecuencia . . . . . . . . . . . . . . . . . . . . . . . . . 301
6.1.4. Relacion entre la respuesta en la frecuencia y en la
respuesta en el tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305
6.2. Sistemas arbitrarios de orden n . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307
6.3. Graficas polares y de Bode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309
6.4. Graficas de respuesta en frecuencia. Ejemplos . . . . . . . . . . . . . . . 319
6.4.1. Ejemplo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319
6.4.2. Ejemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
6.4.3. Ejemplo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322
6.5. Criterio de estabilidad de Nyquist . . . . . . . . . . . . . . . . . . . . . . . . . 325
6.5.1. Recorridos cerrados alrededor de polos y ceros . . . . . . . . 326
6.5.2. Trayectoria de Nyquist . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329
6.5.3. Polos y ceros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331
6.5.4. Criterio de Nyquist. Caso especial . . . . . . . . . . . . . . . . . . . 331
6.5.5. Criterio de Nyquist. Caso general . . . . . . . . . . . . . . . . . . . . 332
6.6. Margenes de estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334
6.7. Relacion entre las caractersticas de respuesta en la frecuencia
y en el tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336
6.7.1. Respuesta en lazo abierto . . . . . . . . . . . . . . . . . . . . . . . . . . . 337
XVI Indice general

6.7.2. Respuesta en lazo cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . 337


6.8. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
6.8.1. Ejemplo de analisis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
6.8.2. Un sistema ball and beam . . . . . . . . . . . . . . . . . . . . . . . . . . 344
6.8.3. Control PD de posicion de un motor de CD . . . . . . . . . . . 355
6.8.4. Rediseno del control PD de posicion de un motor de CD363
6.8.5. Control PID de posicion de un motor de CD . . . . . . . . . . 368
6.9. Caso de estudio. Control PID de un sistema de levitacion
magnetica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376
6.10. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382
6.11. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383
6.12. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391

7. La tecnica de las variables de estado . . . . . . . . . . . . . . . . . . . . . . . 393


7.1. Representacion en variables de estado . . . . . . . . . . . . . . . . . . . . . . 394
7.2. Linealizacion aproximada de ecuaciones de estado no lineales . . 399
7.2.1. Procedimiento para ecuaciones de primer orden sin
entrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 400
7.2.2. Procedimiento general para ecuaciones de orden
arbitrario y numero de entradas arbitrario . . . . . . . . . . . . 402
7.3. Algunos resultados del algebra lineal . . . . . . . . . . . . . . . . . . . . . . . 407
7.4. Solucion de una ecuacion dinamica, lineal e invariante en el
tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410
7.5. Estabilidad de una ecuacion dinamica . . . . . . . . . . . . . . . . . . . . . . 412
7.6. Controlabilidad y observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 413
7.6.1. Controlabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414
7.6.2. Observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416
7.7. Funcion de transferencia de una ecuacion dinamica . . . . . . . . . . 418
7.8. Una de las ecuaciones dinamicas que corresponden a una
funcion de transferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423
7.9. Ecuaciones dinamicas equivalentes . . . . . . . . . . . . . . . . . . . . . . . . . 425
7.10. Control por realimentacion del estado . . . . . . . . . . . . . . . . . . . . . . 428
7.11. Observadores de estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431
7.12. El principio de separacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433
7.13. Caso de estudio. El pendulo con rueda inercial . . . . . . . . . . . . . . 438
7.13.1. Obtencion de la forma en (7.75) . . . . . . . . . . . . . . . . . . . . . 438
7.13.2. Control por realimentacion del estado . . . . . . . . . . . . . . . . 439
7.14. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 440
7.15. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441
7.16. Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445
Indice general XVII

8. Circuitos electronicos realimentados . . . . . . . . . . . . . . . . . . . . . . . 447


8.1. Circuitos electronicos para reducir no linealidades . . . . . . . . . . . 448
8.1.1. Reduccion de la distorsion en amplificadores . . . . . . . . . . 449
8.1.2. Reduccion de la zona muerta en amplificadores. . . . . . . . 451
8.2. Construccion analogica de controladores . . . . . . . . . . . . . . . . . . . . 456
8.3. Diseno de osciladores con forma de onda sinusoidal . . . . . . . . . . 458
8.3.1. Diseno basado en un amplificador operacional. Puente
de Wien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 459
8.3.2. Diseno basado en un amplificador operacional. Red
RC de defasaje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 468
8.3.3. Diseno basado en un transistor . . . . . . . . . . . . . . . . . . . . . . 472
8.4. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494
8.5. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 497

9. Control de velocidad de un motor de CD . . . . . . . . . . . . . . . . . . 499


9.1. Modelo matematico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 500
9.2. Amplificador de potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503
9.3. Control de corriente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504
9.4. Identificacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 507
9.5. Control de velocidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 509
9.5.1. Un controlador PI modificado . . . . . . . . . . . . . . . . . . . . . . . 509
9.5.2. Un controlador con dos grados de libertad . . . . . . . . . . . . 512
9.6. Prototipo experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515
9.6.1. Control de corriente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 518
9.6.2. Amplificador de potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 518
9.7. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519
9.8. Calculo numerico de la integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . 522
9.9. Programacion del microcontrolador PIC16F877A . . . . . . . . . . . . 523
9.10. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527
9.11. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 527

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 529

10. Control de posicion de un motor de CD . . . . . . . . . . . . . . . . . . . 531


10.1. Identificacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532
10.2. Control sin perturbaciones externas (Tp = 0) . . . . . . . . . . . . . . . . 535
10.2.1. Control proporcional con realimentacion de velocidad . . 535
10.2.2. Control con un compensador de adelanto . . . . . . . . . . . . . 537
10.3. Control bajo el efecto de perturbaciones externas . . . . . . . . . . . . 540
10.3.1. Un controlador PID modificado . . . . . . . . . . . . . . . . . . . . . 541
10.3.2. Un controlador con dos grados de libertad . . . . . . . . . . . . 544
10.3.3. Un controlador PID clasico . . . . . . . . . . . . . . . . . . . . . . . . . 549
10.4. Seguimiento de trayectorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553
XVIII Indice general

10.5. Calculo numerico de los algoritmos de control . . . . . . . . . . . . . . . 555


10.6. Construccion del sistema de control . . . . . . . . . . . . . . . . . . . . . . . . 556
10.7. Programacion del microcontrolador PIC16F877A . . . . . . . . . . . . 559
10.8. Control basado en una computadora personal . . . . . . . . . . . . . . . 562
10.9. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 571
10.10.Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 571

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573

11. Control de un sistema de levitacion magnetica . . . . . . . . . . . . . 575


11.1. Modelo matematico no lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 578
11.2. Modelo lineal aproximado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 581
11.2.1. Obtencion de un modelo en variables de estado . . . . . . . . 581
11.2.2. Aproximacion lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 583
11.3. Construccion del prototipo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584
11.3.1. Esfera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584
11.3.2. Electroiman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584
11.3.3. Sensor de posicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584
11.3.4. Controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 586
11.3.5. Lazo de corriente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 587
11.3.6. Amplificador de potencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 587
11.4. Identificacion experimental de los parametros del modelo . . . . . 587
11.4.1. Resistencia del electroiman, R . . . . . . . . . . . . . . . . . . . . . . 587
11.4.2. Inductancia del eletroiman, L(y) . . . . . . . . . . . . . . . . . . . . 587
11.4.3. Ganancia del sensor de posicion, As . . . . . . . . . . . . . . . . . 588
11.4.4. Masa de la esfera, m . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 589
11.5. Diseno del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 590
11.5.1. Un controlador proporcional . . . . . . . . . . . . . . . . . . . . . . . . 593
11.5.2. Un controlador proporcional-integral-derivativo (PID) . . 594
11.6. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 595
11.7. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 599
11.8. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 599

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 601

12. Control de un sistema Ball and Beam . . . . . . . . . . . . . . . . . . . . . 603


12.1. Modelo matematico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605
12.2. Construccion del prototipo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 608
12.2.1. Medicion de la posicion x del baln . . . . . . . . . . . . . . . . . . 609
12.2.2. Medicion de la inclinacion de la varilla . . . . . . . . . . . . . 612
12.2.3. Interfaces y amplificador de potencia . . . . . . . . . . . . . . . . . 612
12.3. Identificacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 614
12.3.1. Sistema de medicion de la inclinacion de la varilla . . . 614
12.3.2. Sistema de medicion de la posicion x del baln . . . . . . . . 614
12.3.3. Subsistema motor-varilla . . . . . . . . . . . . . . . . . . . . . . . . . . . 614
Indice general XIX

12.3.4. Dinamica del baln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 615


12.4. Diseno del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 617
12.5. Construccion del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 620
12.6. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 621
12.7. Control basado en el microcontrolador
PIC16F877A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 630
12.7.1. Construccion del sistema de control . . . . . . . . . . . . . . . . . . 630
12.7.2. Diseno del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 633
12.7.3. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . 633
12.7.4. Programa utilizado en el microcontrolador PIC16F877A 635
12.8. Un sistema de medicion mejorado para la posicion del baln . . . 639
12.9. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 641
12.10.Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 641

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 643

13. Control de un pendulo de Furuta . . . . . . . . . . . . . . . . . . . . . . . . . . 645


13.1. Modelo matematico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 647
13.2. Modelo lineal aproximado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650
13.3. Construccion del pendulo de Furuta e indentificacion de sus
parametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653
13.4. Diseno del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 656
13.5. Construccion del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 657
13.6. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 661
13.7. Resumen del captulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665
13.8. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667

14. Control de un pendulo con rueda inercial . . . . . . . . . . . . . . . . . . 669


14.1. Pendulo con rueda inercial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 670
14.2. Modelo matematico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 672
14.3. Controlador no lineal para levantar el pendulo . . . . . . . . . . . . . . 674
14.4. Controlador para atrapar el pendulo . . . . . . . . . . . . . . . . . . . . . . . 678
14.5. Construccion del pendulo con rueda inercial e identificacion
de sus parametros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 680
14.6. Construccion del controlador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 687
14.7. Resultados experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 691
14.8. Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 699
14.9. Preguntas de repaso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 699

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 701

Indice alfabetico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 703


1
Introduccion

Las aplicaciones del control automatico en la actualidad son muy extensas,


variadas e importantes. Quiza una de las mas populares es la del control de
robots manipuladores en la industria de manufactura. Desde la lneas de en-
samble de automoviles hasta las celdas robotizadas de soldadura. Las razones
principales para este exito es la alta calidad del trabajo, el ahorro de tiempo
y la reduccion del costo de produccion.
2 1 Introduccion

Objetivos del captulo

Comprender de manera intuitiva los conceptos basicos de realimentacion


y control en lazo cerrado, as como los objetivos de un sistema de control.
Conocer la historia del Control Automatico para comprender por que se
desarrollaron este conjunto de herramientas de diseno.
Relacionar los captulos de la presente obra con los hechos historicos que
motivaron los conocimientos descritos en cada captulo.
Con el fin de explicar de que se trata el Control Automatico (o simplemente
control) y cual es su proposito, a continuacion se describe como funciona el
sistema de control del direccionamiento de un canon antiaereo. Las razones
de haber elegido este ejemplo son las siguientes. i) Se trata de un sistema
cuyo objetivo y funcionamiento basico pueden ser entendidos facilmente por la
mayora de las personas debido a la gran cantidad de pelculas, video-juegos,
programas de television, etc., que de alguna manera u otra muestran para
que sirve este sistema de control. ii) Es un problema historicamente muy
importante pues motivo el desarrollo de gran parte de las ideas y tecnicas
basicas del Control Automatico durante la Segunda Guerra Mundial. Este
ejemplo tambien sera utilizado para que el lector pueda relacionar el contenido
del presente libro con algunos de los aspectos de los sistemas de control.

1.1. Sistema de control de un canon antiaereo

En la figura 1.1 se muestra un esquema de este sistema de control. El canon


antiaereo debe apuntar hacia un avion y derribarlo. Para conseguir esto, el
canon debe tener varios movimientos independientes que permitan ajustar su
orientacion () en el plano horizontal y su inclinacion respecto de la horizontal.
Con el fin de simplificar la descripcion del problema, en lo que sigue solo se
considerara el control de la orientacion en el plano horizontal .
Para ajustar la orientacion del canon se utiliza un motor electrico. Esto
se consigue acoplando mecanicamente el motor al canon mediante un juego de
engranes. El conjunto motor-canon funciona, a grandes rasgos, del siguiente
modo. Si se aplica un voltaje positivo al motor entonces el canon recibe un
par en sentido antihorario, por lo que el canon tiende a moverse en sentido
antihorario. Si se aplica un voltaje negativo al motor entonces el canon recibe
un par en sentido horario, por lo que el canon tiende a moverse en sentido
horario. Si el voltaje que se aplica al motor es igual a cero, entonces el par
aplicado sobre el canon es igual a cero, por lo que el canon tiende a detenerse.
La posicion del avion se determina mediante el uso de un radar y se usa este
dato como el valor d que se desea alcance la orientacion del canon . Es decir,
se desea conseguir que = d lo mas rapido posible para, una vez conseguido
1.1 Sistema de control de un canon antiaereo 3

can
on
radar antiaereo

d
motor
v engranes
d

controlador amplificador
de
potencia

Figura 1.1. Sistema de control de un canon antiaereo.

d
d

(a) d > , v > 0, el canon se (b) d < , v < 0, el canon se mueve en


mueve en sentido antihorario. sentido horario.

Figura 1.2. El canon antiaereo siempre debe moverse hacia la orientacion deseada.

esto, disparar1 . De acuerdo al funcionamiento descrito en el parrafo anterior,


una manera sencilla de conseguir esto es aplicando al motor un voltaje v que
sea calculado de acuerdo a la siguiente regla:

v = kp (d ) (1.1)

donde kp es una constante positiva. La operacion presentada en (1.1) es rea-


lizada utilizando equipo electronico de baja potencia (una computadora o un
microcontrolador, por ejemplo) y se debe utilizar un amplificador de potencia
para satisfacer los requerimientos del motor electrico. En este caso se esta su-
poniendo que el amplificador de potencia ofrece una amplificacion unitaria
1
Sin embargo, en una situacion real, es necesario que la orientacion del canon vaya
adelante de la posicion del avion con el fin de compensar el tiempo que la bomba
tarda en viajar desde que es disparada hasta que llega a donde esta el avion.
Aqu se esta despreciando este efecto con el fin de simplificar la exposicion.
4 1 Introduccion

en voltaje, pero realiza una gran amplificacion en corriente electrica (vease el


captulo 9, seccion 9.2). De acuerdo a la figura 1.2 se puede presentar alguna
de las siguientes situaciones:
Si < d , entonces v > 0 y el canon gira en sentido antihorario de modo
que se aproxima a d .
Si > d , entonces v < 0 y el canon gira en sentido horario de modo que
se aproxima a d .
Si = d , entonces v = 0 y el canon no gira por lo que la condicion = d
se puede mantener para siempre.
A partir de este razonamiento se concluye que la regla presentada en (1.1) para
determinar el voltaje que se ha de aplicar al motor tiene buenas posibilidades
de funcionar en la practica.
A la regla en (1.1) se le conoce como ley de control o, simplemente, contro-
lador. En la figura 1.3 se muestra un diagrama de bloques de los componentes
del sistema de control de un canon antiaereo. Notese que la construccion del
controlador en (1.1) requiere que la posicion del canon (tambien conocida
como la salida) sea usada para generar el voltaje v (tambien conocido como
la entrada) que se aplica al motor. Este hecho define los conceptos de reali-
mentacion y de sistema en lazo cerrado. Esto indica que el sistema de control
compara la posicion del motor (, salida) con la posicion deseada o referencia
(d ) y aplica al motor un voltaje v que depende de la diferencia existente entre
estas variables (vease (1.1)).

amplificador
d
+ controlador de v motor
potencia can
on
kp
1

Figura 1.3. Diagrama de bloques del sistema de control de un canon antiaereo.

Si se define el error de posicion como la diferencia d , se dice que


el error en estado estacionario2 del sistema de control de posicion es cero
porque, de acuerdo a lo arriba explicado, d = 0 puede mantenerse para
siempre. Sin embargo, el termino en estado estacionario indica que esto
se conseguira cuando el tiempo sea suficientemente grande como para que el
canon deje de moverse. As que aun queda el problema de determinar como
evolucionara el movimiento del canon conforme se aproxima a d . A esto se
le conoce como la respuesta transitoria del sistema de control 3 . En la figura
2
Vease el captulo 4
3
Veanse los captulos 3, 5 y 6
1.1 Sistema de control de un canon antiaereo 5

1.4 se muestran varios ejemplos de como puede ser la respuesta transitoria.


Notese que si kp es grande en (1.1) entonces el voltaje v que se aplica al
motor es mayor por lo que el par sobre el canon tambien es mayor y, por tanto,
girara mas rapido. Entonces, el tiempo que debe transcurrir para que alcance
a d sera menor. Sin embargo, un movimiento rapido del canon y la inercia
propia del mismo pueden provocar que cuando alcance a d la velocidad del
canon sea diferente de cero 6= 0 por lo que el canon continuara moviendose
y cambiara el signo de d . Entonces la posicion puede efectuar varias
oscilaciones alrededor de d antes de que el canon se detenga. Esto significa
que el valor de kp tiene un efecto importante sobre la forma de la respuesta
transitoria por lo que debe ser calculada de modo que se obtenga la respuesta
transitoria deseada (rapida y sin oscilaciones). Incluso, para conseguir esto, en
ocasiones no sera suficiente con ajustar el valor de kp y debera modificarse la
regla en (1.1), es decir se debera utilizar otro controlador (veanse los captulos
5, 6, 7 y 10). Es mas, el error en estado estacionario puede ser diferente de cero
( 6= d cuando el motor alcanza el reposo) debido a perturbaciones externas
(el viento, por ejemplo, puede desviar al canon de su posicion u orientacion
deseada) o por efectos tales como la friccion existente entre las partes moviles
de todo el mecanismo. Esto significa que incluso la busqueda de un error en
estado estacionario que sea cero o, al menos, suficientemente pequeno puede
ser una razon para buscar un nuevo controlador.

0
0
tiempo

Figura 1.4. Tres formas posibles de la respuesta transitoria en el control de un


canon antiaereo.
6 1 Introduccion

Un aspecto muy importante en el diseno del sistema de control es la es-


tabilidad del mismo. El concepto de estabilidad puede interpretarse a groso
modo recordando lo que ocurre en un pendulo simple (vease la figura 1.5).
Si la posicion deseada del pendulo es = 0 entonces basta con dejar que el
pendulo se mueva libremente (con un par externo igual a cero, T (t) = 0) y
el pendulo oscilara hasta que, por efecto de la friccion, alcanzara el reposo en
= 0. Entonces se dice que, bajo esta situacion, el pendulo es estable porque
alcanza la posicion deseada = 0 en estado estacionario a partir de cual-
quier posicion inicial suficientemente cercana. Por otro lado, si se desea que
el pendulo alcance la posicion = es claro que, por efecto de la gravedad,
el pendulo siempre se aleja de esa configuracion por cercana que se elija la
posicion inicial respecto de ese valor deseado = . Entonces se dice que bajo
esa situacion el pendulo es inestable4 . Notese que, de acuerdo a esta descrip-
cion intuitiva, el sistema de control de un canon antiaereo es inestable si la
ley de control en (1.1) utiliza una constante kp negativa: en este caso el canon
se movera de modo que se aleja de d . Por tanto, el valor de la constante
kp tambien determina la estabilidad del sistema de control y debe elegirse de
manera que la asegure 5 . Notese que si el sistema de control es inestable (kp
negativa) entonces el error en estado estacionario nunca sera cero a pesar de
que la regla en (1.1) indica que el motor se detiene cuando = d . Esto se
debe a que, incluso si = d desde el principio, la medicion de la posicion
siempre esta contaminada de ruido el cual producira que 6= d en (1.1) y
esto sera suficiente para que, de acuerdo a lo explicado previamente, se aleje
de d .

T(t)

l

g
m

Figura 1.5. Pendulo simple.

Otro factor importante en el sistema de control de un canon antiaereo es


el movimiento que describe el avion por derribar. Es claro que si la direccion
4
Este es precisamente el termino que coloquialmente se usa pare describir que el
pendulo no puede permanecer en = para siempre
5
Veanse los captulos 3, 4, 5, 6, 7
1.1 Sistema de control de un canon antiaereo 7

d , que indica en donde se encuentra el avion, es constante entonces el avion


sera derribado mas facilmente que si el avion se aleja a gran velocidad (cuan-
do d cambia rapidamente) o cuando el avion acelera para escapar (cuando la
segunda derivada de d es grande). Por tanto, la ley de control en (1.1) debe
ser disenada de manera que el sistema de control responda correctamente ba-
jo cualquiera de las tres situaciones anteriormente descritas. En caso que d
tenga una forma diferente a las consideradas, se supone que el sistema de con-
trol respondera correctamente si responde bien ante las tres situaciones antes
consideradas. Esta es la idea detras del diseno del error en estado estacionario
del sistema, descrito en el captulo 4.
De acuerdo a lo anterior, se puede decir que las tres caractersticas fun-
damentales de un sistema de control son la respuesta transitoria, la respuesta
en estado estacionario (o error en estado estacionario) y la estabilidad. El
controlador debe ser disenado de manera que estas tres partes fundamenta-
les de la respuesta de un sistema de control cumplan con las especificaciones
requeridas: rapidez y pocas oscilaciones (respuesta transitoria), que la posi-
cion del canon alcance (o sea muy cercana a) la posicion deseada cuando el
tiempo sea suficientemente grande (respuesta en estado estacionario) y que
el sistema de control sea estable. Para conseguir esto, las tecnicas de control
estudiadas en la presente obra se basan en el estudio del modelo matematico
del sistema de control completo. De acuerdo a lo expuesto en el captulo 2,
este modelo matematico esta dado en terminos de una ecuacion diferencial
ordinaria, lineal y de coeficientes constantes. Por esta razon, en el captulo 3
se estudia la solucion de este tipo de ecuaciones diferenciales para definir las
propiedades que determinan su estabilidad as como la forma transitoria de la
solucion y el valor final de la misma. El conocimiento de como es la solucion
de estas ecuaciones diferenciales es fundamental para los metodos de diseno
de controladores que se estudian en este libro.
Los metodos de diseno que se usan en esta obra pueden dividirse en clasicas
y modernas. Las tecnicas de control clasicas son estudiadas en los captulos
3, 4, 5, 6 y existen dos metodologas diferentes: las tecnicas de respuesta en
el tiempo (captulo 5) y las tecnicas de la respuesta en la frecuencia (captulo
6). Las tecnicas de control clasico estan basadas en el uso de la transformada
de Laplace para resolver y analizar ecuaciones diferenciales. Las tecnicas de
la respuesta en el tiempo se basan en determinar la forma de la respuesta
temporal de un sistema de control a partir de la ubicacion de los polos de la
funcion de transferencia correspondiente (captulo 3) y el metodo principal de
diseno es el Lugar de las Races (captulo 5). Las tecnicas de la respuesta en la
frecuencia explotan la idea fundamental detras de la Transformada de Fourier:
los sistemas de control (lineales) funcionan como filtros de tal manera que,
ante una orden, la respuesta del sistema de control esta basicamente dada
como esa orden filtrada por el sistema de control. Es por esta razon que
las herramientas fundamentales de diseno para esta tecnica son las graficas
polares y de Bode (captulo 6) ampliamente utilizadas en el diseno y analisis
de filtros (pasa altas, pasa bajas, pasa banda, etc.). En los captulos 8, 9, 10,
8 1 Introduccion

11 y 12 se presentan algunas aplicaciones experimentales de las tecnicas de


control clasico.
Por otro lado, las tecnicas modernas que se abordan en este libro estan
representadas por las basadas en las variables de estado (captulo 7) las cua-
les, a diferencia de las tecnicas clasicas permiten estudiar el comportamiento
del interior del sistema de control. Esto significa que las variables de estado
suministran mas informacion que puede ser aprovechada para conseguir me-
jores resultados. Ejemplos de aplicaciones de estas tecnicas son mostrados en
los captulos 13 y 14.

1.2. Historia del Control Automatico

Una vez que se ha descrito a groso modo que es lo que se persigue al disenar
un sistema de control as como algunos conceptos utiles para conseguirlo, a
continuacion se presenta una breve historia del Control Automatico. El obje-
tivo es que el lector se de cuenta de como han sido formulados estos conceptos
y, ademas, pueda apreciar cuales han sido las necesidades ingenieriles que han
motivado estas ideas. Tambien se indican las partes del presente libro en don-
de se abordan los principales conceptos y tecnicas de los sistemas de control.
El contenido de esta seccion esta basado en la informacion reportada en [1].
El Control Automatico se ha usado desde hace mas de 2000 anos. Se tiene
conocimiento de la existencia de relojes de agua, construidos por Ktesibios,
hacia el ano 270 antes de Cristo, as como una variedad de mecanismos in-
geniosos construidos en Alejandra y descritos por Heron. Sin embargo, des-
de el punto de vista de la ingeniera, el avance mas importante en Control
Automatico se debio a James Watt en 1789 al introducir un regulador de ve-
locidad para su maquina de vapor. Sin embargo, a pesar de su importancia, el
regulador de velocidad de Watt tena varios problemas. Se observaba que en
ocasiones la velocidad variaba de manera oscilatoria en lugar de permanecer
constante o creca sin lmite. Tratando de determinar bajo que condiciones se
poda asegurar un funcionamiento estable, entre 1826 y 1851 J.V. Poncelet
y G.B. Airy mostraron que era posible utilizar ecuaciones diferenciales para
representar el funcionamiento completo de la maquina de vapor junto con el
regulador de velocidad (vease el captulo 2 para el problema del modelado de
sistemas fsicos).
En esas fechas los matematicos saban que la estabilidad de una ecuacion
diferencial estaba determinada por la ubicacion de las races de la ecuacion
caracterstica correspondiente y se saba que haba inestabilidad si la parte
real de una raz era positiva (vease el captulo 3, seccion 3.8). Sin embargo, no
era sencillo calcular el valor numerico de dichas races y en ocasiones ni siquie-
ra era posible. As, en 1868 J.C. Maxwell mostro la manera de determinar la
estabilidad de las maquinas de vapor con el regulador de Watt simplemente
examinando los coeficientes de la ecuacion diferencial que la representa. Sin
embargo, este resultado solo era util para ecuaciones diferenciales de segundo,
1.2 Historia del Control Automatico 9

tercero y cuarto orden. Mas tarde, entre 1877 y 1895 y de manera indepen-
diente, E.J. Routh y A. Hurwitz dedujeron un metodo para determinar la
estabilidad de sistemas de cualquier orden, resolviendo el problema que Max-
well haba dejado abierto. Este metodo ahora es conocido como el Criterio de
Routh o de Routh-Hurwitz (vease el captulo 4, seccion 4.3).
Durante gran parte del siglo XIX se desarrollaron muchas aplicaciones
relacionadas con el Control Automatico entre las cuales estaban el control
de temperatura, de presion, de nivel de lquidos y la velocidad de maquinas
rotativas. Por otro lado, se empezo a usar el vapor para mover grandes canones
y para actuar sobre el sistema de direccion de barcos cada vez mas grandes.
Incluso, por esa epoca, en Francia se introdujeron los terminos de servomotor
y servomecanismo para describir un movimiento generado por un servidor o
esclavo. Sin embargo, la mayora de los controladores de ese entonces eran
del tipo encendido-apagado y fueron personas como E. Sperry y M.E. Leeds
quienes se dieron cuenta de que los mejores operadores humanos empleaban
el sentido de anticipacion disminuyendo la potencia conforme la variable a
controlar se acercaba a su valor deseado. Fue N. Minorsky quien en 1922
presento un analisis claro de los sistemas de control de posicion y formulo lo
que hoy en da se conoce como controlador PID (vease el captulo 5, seccion
5.2.5). Este controlador fue deducido observando la manera en que el piloto
humano de un barco controla su direccion.
Por otro lado, desde 1920 la amplificacion haba producido muchos proble-
mas a las companas telefonicas ya que se distorsionaba fuertemente la senal
de audio. Fue en esa epoca que H.S. Black encontro que si una pequena can-
tidad de la senal obtenida a la salida de un amplificador se utilizaba para ser
realimentada a la entrada del mismo se poda reducir la distorsion producida
por el amplificador. Durante el desarrollo de este trabajo, Black fue ayudado
por H. Nyquist quien, a partir de esas experiencias, publico en 1932 un trabajo
titulado Regeneration Theory en donde establecio las bases de lo que ahora
es conocido como el Analisis de Nyquist (vease el captulo 6, seccion 6.5).
Durante el perodo 1935-1940, las companas telefonicas deseaban ampliar
el ancho de banda de sus sistemas de comunicacion para aumentar el numero
de sus usuarios. Para esto necesitaban que sus lneas telefonicas presentaran
una buena caracterstica de respuesta en frecuencia (vease el captulo 6): una
ganancia constante sobre un amplio rango de frecuencias con un pequeno
angulo de atraso y una aguda pendiente de atenuacion a partir de una deter-
minada frecuencia de corte. Motivado por este problema, H. Bode estudio la
relacion existente entre una caracterstica de atenuacion dada y el mnimo
corrimiento de fase que se le puede asociar. Como resultado introdujo los con-
ceptos de margen de ganancia y margen de fase (vease el captulo 6, seccion
6.6) y empezo a manejar el punto (1, 0) del plano complejo como un punto
crtico en lugar del punto (+1, 0) manejado por Nyquist. Detalles completos
del trabajo de Bode aparecieron en 1945 en su libro Network Analysis and
Feedback Amplifier Design.
10 1 Introduccion

Pero fue la Segunda Guerra Mundial la que hizo que el trabajo en sistemas
de control se concentrara en unos pocos problemas especficos. El mas impor-
tante de estos fue el relacionado con el direccionamiento de canones antiaereos.
El trabajo en este problema motivo el desarrollo de nuevas ideas en el control
de servomecanismos. G. S. Brown del Instituto Tecnologico de Massachusetts
mostro que muchos sistemas electricos y mecanicos pueden ser representados
y manipulados usando diagramas de bloques (vease el captulo 4, seccion 4.1)
y A. C. Hall mostro en 1943 que manejando los bloques como funciones de
transferencia (vease el captulo 3) poda obtenerse la funcion de transferencia
del sistema completo para finalmente usar el criterio de estabilidad de Nyquist
y determinar los margenes de ganancia y de fase.
Los investigadores en el Instituto Tecnologico de Massachusetts usaron
circuitos de adelanto (vease el captulo 10, seccion 10.2.2) en el trayecto directo
para modificar el desempeno del sistema de control, mientras que en el Reino
Unido se usaron varios lazos internos para modificar la respuesta del sistema
de control.
Hacia el final de la Segunda Guerra Mundial las tecnicas de respuesta en
frecuencia basadas en el metodo de Nyquist y las graficas de Bode ya estaban
bien establecidas, describiendo el desempeno del sistema de control en termi-
nos de ancho de banda, frecuencia de resonancia, margen de fase y margen
de ganancia (vease el captulo 6). El enfoque alternativo a estas tecnicas se
basaba en la solucion de las ecuaciones diferenciales usando la Transforma-
da de Laplace y describan el desempeno del sistema de control en terminos
del tiempo de subida, sobre paso, error en estado estacionario y el amorti-
guamiento (vease el captulo 3, seccion 3.3). Muchos ingenieros preferan este
metodo porque los resultados estaban expresados en terminos reales. Pero
este enfoque tena la desventaja de que no exista una manera sencilla que
permitiera al disenador relacionar los cambios en los parametros con cambios
en la manera en que responda el sistema. Fue precisamente el metodo del
Lugar de las Races (vease el captulo 5, secciones 5.1 y 5.2) introducido en
1948 y 1950 por W. Evans el que permitio librar estos obstaculos. As, hacia
esas fechas las ahora llamadas tecnicas de control clasico estaban bien estable-
cidas y estaban orientadas a sistemas que podan ser descritos por ecuaciones
diferenciales lineales con coeficientes constantes y con una sola entrada.
Entonces vino la era de los vuelos supersonicos y espaciales. Era necesario
utilizar modelos fsicos detallados representables en ecuaciones diferenciales
que podan ser lineales o no lineales. Los ingenieros que trabajaban en las
industrias aeroespaciales encontraron que siguiendo las ideas de Poincare era
posible formular ecuaciones diferenciales generales en terminos de un conjunto
de ecuaciones diferenciales de primer orden y as empezo a nacer lo que hoy
se conoce como la tecnica de las variables de estado (vease el captulo 7).
Un gran impulsor de esta tecnica fue R. Kalman quien, alrededor de 1960,
presento los conceptos de controlabilidad y observabilidad (vease la seccion
7.6).
1.3 Prototipos didacticos 11

Finalmente, se debe decir que a partir de esas fechas se han detectado nue-
vos problemas en los sistemas de control que han motivado la introduccion
de diversas tecnicas de control que aun hoy en da se siguen desarrollando.
Por ejemplo, las no linealidades encontradas en los servomecanismos ha mo-
tivado el desarrollo de las tecnicas de control no lineal. El control de aviones
supersonicos, que deben operar bajo amplios rangos de temperatura, presion,
velocidad, etc., motivo el desarrollo de control adaptable. La introduccion
de sistemas de control basados en radar motivo el desarrollo de tecnicas de
control para sistemas en tiempo discreto, etc.

1.3. Prototipos didacticos

En las secciones previas se ha mencionado que el Control Automatico ha


sido desarrollado con el fin de resolver problemas de ingeniera importantes.
Sin embargo, la ensenanza de las tecnicas del Control Automatico necesita que
el estudiante pueda practicar aplicando sus conocimientos de manera experi-
mental. Como es difcil hacer uso de instalaciones industriales complejas o de
laboratorios de alta tecnologa con este proposito, en la ensenanza del Control
Automatico se recurre a los llamados prototipos didacticos. Un prototipo
didactico es un dispositivo que tiene dos caractersticas principales: i) es
suficientemente sencillo como para que pueda ser construido y ser puesto en
marcha usando diferentes controladores, e ii) que sea un modelo suficiente-
mente complejo como para que se puedan apreciar los diferentes aspectos de
un sistema de control. A continuacion se listan los prototipos didacticos usados
en este libro y se indica cuales son las herramientas del Control Automatico
que son utilizadas en dichos prototipos:
Circuitos electronicos osciladores basados en amplificadores operacionales
y transistores (captulo 8). Respuesta en frecuencia, criterio de estabilidad
de Nyquist y criterio de estabilidad de Routh.
Motores de CD con escobillas e iman permanente (captulos 9 y 10). Diseno
de varios controladores basicos en servomecanismos utilizando la respuesta
en el tiempo: proporcional, proporcional-derivativo, proporcional-integral,
proporcional-integral-derivativo, compensadores de adelanto, controlado-
res con dos grados de libertad.
Sistema de levitacion magnetica (captulo 11). Diseno de un controlador
PID usando el concepto de aproximacion lineal de un sistema no lineal y
el metodo del lugar de las races.
Sistema ball and beam (captulo 12). Diseno de un sistema multilazo
usando la respuesta en frecuencia (criterio de Nyquist y graficas de Bode)
y el lugar de las races.
Pendulo de Furuta (captulo 13). Diseno de un controlador por realimen-
tacion del estado usando la tecnica de la variable de estado. Se utiliza una
aproximacion lineal de un sistema no lineal.
12 1 Introduccion

Pendulo con rueda inercial (captulo 14). Diseno de dos controladores por
realimentacion del estado usando la tecnica de la variable de estado. Uno
de los controladores es disenado utilizando el modelo no lineal completo
del mecanismo y es utilizado para dar al lector una pequena introduccion
al control de sistemas no lineales.

1.4. Resumen del captulo


En el presente captulo se ha explicado de manera intuitiva cual es la idea
fundamental de controlar un sistema en lazo cerrado. Para esto se ha descrito
como funciona el sistema de control de un canon antiaereo. Tambien se ha ex-
plicado, mediante el mismo ejemplo, que es lo que se busca cuando se disena
un sistema de control. Se ha presentado una breve descripcion de la historia
del Control Automatico para que el lector entienda que todos los conceptos
detras de las herramientas de los sistemas de control han sido motivados por
problemas tecnologicos importantes. Esta descripcion historica ha sido utili-
zada para indicar en que partes de la presente obra se abordan las diferentes
herramientas del Control Automatico.

1.5. Preguntas de repaso

1. Para que podra el lector usar el Control Automatico?


2. Podra hacer una lista del equipo domestico que utilice la realimentacion?
3. Investigue como funciona un reloj de pared (que utiliza un pendulo)
Como cree que intervenga la realimentacion en el funcionamiento de estos
relojes?
4. Por que es historicamente importante el regulador de velocidad de Watt
para una maquina de vapor?
5. Que significa que un sistema de control sea inestable?
6. Que entiende por rapidez de respuesta?
7. Por que se dice que un pendulo invertido es inestable?
8. Por que se desarrollaron primero las tecnicas de respuesta en frecuencia
antes de las tecnicas de respuesta en el tiempo?
Referencias

1. S. Bennett, A brief history of automatic control, IEEE Control Systems Maga-


zine, pp. 17-25, June 1996.
2. G.W. Evans, The story of Walter R. Evans and his textbook Control-Systems
Dynamics, IEEE Control Systems Magazine, pp. 74-81, December 2004.
3. D.A. Mindell, Anti-aircraft fire control and the develoment of integrated systems
at Sperry, 1925-1940, IEEE Control Systems Magazine, pp. 108-113, April 1995.
4. S.W. Herwald, Recollection of the early development of servomechanism and
control systems, IEEE Control Systems Magazine, pp. 29-32, november 1984.
5. D.S. Bernstein, Feedback control: an invisible thread in the history of technology,
IEEE Control Systems Magazine, pp. 53-68, April 2002.
6. W. Oppelt, On the early growth of conceptual thinking in the control system
theory- The German role up to 1945, IEEE Control Systems Magazine, pp.
16-22, November 1984.
7. S. Bennett, Nicolas Minorsky and the automatic steering of ships, IEEE Control
Systems Magazine, pp. 10-15, November 1984.
2
Modelado matematico de sistemas fsicos

El modelado matematico de sistemas fsicos consiste en obtener un conjun-


to de ecuaciones que, al ser resueltas, muestran como evolucionan las variables
importantes del sistema. Esto se consigue describiendo matematicamente, y
por separado, a cada una de las partes que componen al sistema por mo-
delar. Finalmente, estos modelos matematicos aislados deben ser conectados
de acuerdo a la configuracion que mantienen dentro del sistema completo,
respetando las leyes de la naturaleza que los rigen.
16 2 Modelado matematico de sistemas fsicos

Objetivos del captulo

Darse cuenta de que el modelo matematico de los sistemas fsicos esta cons-
tituido por ecuaciones diferenciales.
Aprender a obtener el modelo matematico de sistemas mecanicos, electri-
cos y electromecanicos.
Identificar a los sistemas fsicos como la interconexion de procesadores de
energa.
Identificar las analogas entre sistemas de diferente naturaleza, a partir de
la manera en que procesan la energa.
Tradicionalmente, cuando se aborda el modelado de sistemas fsicos se re-
curre a los metodos especficos desarrollados para cada tipo de sistema. Es
decir, los sistemas electricos son modelados usando los metodos desarrollados
en la teora de circuitos electricos y cuando se trata de sistemas mecanicos
se usan los metodos desarrollados en ingeniera mecanica. Sin embargo, pro-
ceder de esta manera tiene varias desventajas: i) la persona no especializada
en el tema en cuestion debe simplemente aceptar (sin muchas explicaciones)
los metodos de modelado desarrollados en esa rama del conocimiento, ii) el
estudiante no se da cuenta de que las leyes fsicas utilizadas para el modelado
de sistemas de diferente naturaleza estan relacionadas por analogas; aunque
en todo curso de control automatico siempre se tratan de resaltar las ana-
logas, estas tienen que ser explicadas a partir de las ecuaciones resultantes
del modelado y no se puede ver que es la esencia del fenomeno la que tiene su
contraparte en sistemas de diferente naturaleza.
Una manera de estudiar el modelado de sistemas fsicos de diferente natu-
raleza bajo una perspectiva unificada es utilizando un concepto que es comun
a varios ambitos de la ingeniera: la energa del sistema. Por esta misma razon
en esta obra el modelado de sistemas se limita a sistemas electricos y mecani-
cos los cuales pueden estudiarse usando conceptos generales de energa que
son comunes a todos estos sistemas. La idea fundamental del uso de la energa
para el modelado es que los componentes de cada sistema bajo estudio suminis-
tran, almacenan o disipan energa y cuando se unen para formar un sistema
complejo es cuestion de determinar como esa energa es transmitida de un
componente a otro.
Este enfoque de usar la energa para el modelado (y, por tanto, el presente
captulo) esta basado en las ideas introducidas en [1].

2.1. Energa y variables generalizadas del sistema


En dos sistemas que se encuentran conectados el intercambio de energa
se realiza a traves de un puerto, el cual puede ser conceptualmente descrito
como formado por dos terminales comunes a ambos sistemas (vease la figura
2.1). La energa es intercambiada entre estos sistemas atraves de dos variables
2.1 Energa y variables generalizadas del sistema 17

generalizadas que se identifican bajo los conceptos generales de esfuerzo e


y flujo f . Estas variables, al ser generalizadas, estan definidas en cualquier
sistema independientemente de su naturaleza. Por tanto, no se confundan
estas variables con las variables esfuerzo y flujo definidas en resistencia de
materiales (esfuerzo) y mecanica de fluidos (flujo). Las variables generalizadas
de esfuerzo y flujo pueden ser distinguidas a partir de la manera en que son
medidas. El esfuerzo es medido utilizando un instrumento que se conecta
entre ambas terminales del puerto (en la literatura en ingles se usa el termino
across para describir estas variables). Ejemplos de estas variables son el voltaje
(sistemas electricos), la presion (sistemas de fluidos) y la velocidad (sistemas
mecanicos): estas variables se miden entre dos puntos porque necesitan ser
medidas respecto a un valor de referencia. El flujo es medido utilizando un
instrumento que se conecta a lo largo de una de las terminales del puerto (en
la literatura en ingles se usa el termino through para describir estas variables).
En este caso no se necesita especificar un valor de referencia sino que se mide
la variable que fluye a traves del sistema. Ejemplos de estas variables son el
flujo de fluidos (sistemas de fluidos), la corriente electrica (sistemas electricos)
y la fuerza (sistemas mecanicos).

f
Sistema Sistema
1 e 2

puerto

Figura 2.1. Dos sistemas conectados a traves de un puerto.

En este enfoque en el cual lo sistemas son considerados como procesadores


de energa, el producto de las variables de esfuerzo y flujo es igual a la potencia
instantanea (w) intercambiada a traves del puerto:

w = ef

Para cada uno de los componentes del sistema se debe definir una convencion
de signos para las variables generalizadas de esfuerzo y de flujo (vease la figura
2.2). De este modo, si la potencia w tiene signo positivo para el componente i
entonces este componente recibe energa en ese instante. Si la potencia w tiene
signo negativo para el elemento i entonces el componente entrega energa a
los otros componentes del sistema en ese instante.
La energa intercambiada (E) en el intervalo de tiempo [0, t] esta dada
como la integral de la potencia instantanea:
18 2 Modelado matematico de sistemas fsicos

Componente
e
i

Figura 2.2. Sentidos definidos como positivos para las variables de esfuerzo y flujo.

Z t
E= ef dt (2.1)
0

Si la energa E es positiva para el componente i, entonces E representa la


energa que este componente ha recibido en el intervalo de tiempo [0, t], pero si
E es negativa entonces E representa la cantidad de energa que el componente
ha entregado a los otros componentes del sistema en el intervalo de tiempo
[0, t].
Ejemplo 2.1 En un circuito electrico, la potencia (w) esta dada como el
producto de la corriente electrica i (A, Amperes) a traves del circuito y el
voltaje v (V, volts) medido entre las terminales del circuito, mientras que la
energa (E) intercambiada (puede ser recibida o entregada dependiendo del
signo de E) en el intervalo de tiempo [0, t] se calcula como la integral de la
potencia:
Z t
w = iv, E = iv dt
0

En un sistema mecanico traslacional, la potencia (w) esta dada como el


producto de la fuerza aplicada F (N, Newton) y la velocidad v (m/s, me-
tros/segundo), mientras que la energa (E) intercambiada en el intervalo de
tiempo [0, t] se calcula como la integral de la potencia:
Z t
w = F v, E = F v dt
0

En un sistema mecanico rotativo, la potencia (w) esta dada como el producto


del par aplicado T (Nm, Newtonmetro) y la velocidad angular (rad/s,
radian/segundo), mientras que la energa (E) intercambiada en el intervalo
de tiempo [0, t] se calcula como la integral de la potencia:
Z t
w = T , E = T dt
0

En un sistema de fluidos, la potencia (w) esta dada como el producto de la pre-


sion P (N/m2 , Newton/metro2 ) y el flujo del fluido Q (m3 /s, metro3 /segundo),
mientras que la energa (E) intercambiada en el intervalo de tiempo [0, t] se
calcula como la integral de la potencia:
2.2 Almacenadores de energa 19
Z t
w = P Q, E= P Q dt
0

Se recomienda hacer el analisis dimensional correspondiente en cada caso pa-


ra verificar que la energa siempre esta dada en Joules=Newtonmetro y la
potencia en Joules/segundo.
Los componentes de un sistema pueden clasificarse de la siguiente manera,
de acuerdo a la accion que realizan sobre la energa E que intercambian:
Almacenadores de energa.
Disipadores de energa.
Fuentes de energa.
Convertidores.
A continuacion se estudia cada una de estas funciones.

2.2. Almacenadores de energa


Existen dos maneras de almacenar la energa: i) mediante el almacena-
miento de esfuerzo e ii) mediante el almacenamiento de flujo. Estas dos ma-
neras de almacenar la energa definen dos nuevas variables: la acumulacion de
esfuerzo (ea ) y la acumulacion de flujo (fa ):
Z t
dea
ea = e dt, e =
0 dt
Z t
dfa
fa = f dt, f =
0 dt
Notese que a partir de estas expresiones tambien se puede escribir:

e dt = dea , f dt = dfa

lo cual, al ser sustituido en (2.1) da origen a las siguientes expresiones para


la energa almacenada en terminos de la acumulacion de esfuerzo:
Z ea (t)
E= f dea (2.2)
ea (0)

y para la energa almacenada en terminos de la acumulacion de flujo:


Z fa (t)
E= e dfa (2.3)
fa (0)

Para poder calcular la integral en (2.2) es necesario que el flujo f se pueda


escribir como funcion de la acumulacion de esfuerzo ea , es decir que se pueda
escribir:
20 2 Modelado matematico de sistemas fsicos

f = (ea )

Por otro lado, para poder calcular la integral en (2.3) es necesario que el
esfuerzo e se pueda escribir como funcion de la acumulacion de flujo fa , es
decir que se pueda escribir:

e = (fa )

En cada caso, las funciones y se conocen como las funciones constituti-


vas del componente del sistema que realiza la accion de almacenamiento de
esfuerzo o de flujo. A continuacion se estudian los componentes que realizan
el almacenamiento de esfuerzo o de flujo en sistemas de diferente naturaleza.

2.2.1. Sistemas mecanicos traslacionales

Almacenamiento de flujo

En la figura 2.3 se muestra un cuerpo rgido (sin flexibilidad) de masa m


(positiva) que se mueve con velocidad v12 (v12 = e, esfuerzo) bajo el efecto de
una fuerza F (F = f , flujo). Se supone que no existe friccion entre el cuerpo
y el medio que lo rodea. Los sentidos mostrados para la fuerza y la velocidad
son los sentidos que se definen como positivos para este tipo de componente
de sistema. Bajo estas condiciones, la Segunda Ley de Newton [2], pag. 89,
establece que:

F = ma (2.4)

donde a = dvdt12 es la aceleracion del cuerpo. La siguiente manera de definir el


momentum p:

p = mv12 (2.5)

es muy conveniente porque se puede integrar (2.5) y (2.4) para concluir que el
momentum es la acumulacion de flujo (p = fa ), es decir que se puede escribir:
Z t
p= F dt + p(0)
0

A partir de (2.5) se concluye que la funcion constitutiva es:


1
v12 = (p) = p, (e = (fa ))
m
Entonces, sustituyendo v12 = e, p = fa y v12 = p/m en (2.3) y suponiendo
que p(0) = 0, se encuentra que la energa almacenada esta dada como:
Z p
1 1 2 1 2
E= p dp = p = mv12
0 m 2m 2
lo cual constituye la expresion bien conocida para la energa cinetica.
2.2 Almacenadores de energa 21
v 12

m F
2

Figura 2.3. Un cuerpo rgido de masa m como almacenador de flujo en sistemas


mecanicos traslacionales.

Almacenamiento de esfuerzo

En la figura 2.4 se muestra un resorte que se deforma (se comprime o se


estira) a una velocidad v12 (v12 = e, esfuerzo) bajo el efecto de una fuerza F
(F = f , flujo). Notese que aunque la fuerza F se aplica en el extremo 1 del
resorte, debe considerarse que una fuerza del mismo valor y de sentido con-
trario aparece en el extremo 2 del resorte para que sea posible la deformacion.
Ademas, v12 = v1 v2 donde v1 y v2 son las velocidades de los extremos 1 y
2 del resorte, respectivamente. Los sentidos mostrados para la fuerza y las ve-
locidades son los que se definen como positivos para este tipo de componente
de sistema. Notese que la velocidad v12 indica que el extremo 1 del resorte
se aproxima al extremo 2 del resorte. Se supone que el resorte no tiene masa
y que la deformacion no es permanente ni produce calor. El almacenamiento
de energa en un resorte se realiza mediante el desplazamiento neto del re-
sorte respecto de su estado nominal. El estado nominal del resorte puede ser
definido como aquel en el cual el resorte no esta ni estirado ni comprimido,
pero en algunos casos tambien puede ser definido como aquel en el cual el
sistema mecanico completo esta en reposo aunque el resorte este comprimido
o estirado en esa situacion de reposo. Por tanto, la acumulacion de esfuerzo
se define como el desplazamiento neto (ea = x12 ):

v 12
1 2
F F
v1 v2

Figura 2.4. Un resorte como almacenador de esfuerzo en sistemas mecanicos tras-


lacionales.

Z t
x12 = v12 dt + x12 (0) (2.6)
0
22 2 Modelado matematico de sistemas fsicos

donde x12 = x1 x2 con x1 y x2 las posiciones de los extremos 1 y 2 del


resorte, respectivamente. De acuerdo al sentido de la velocidad v12 que se ha
definido en la figura 2.4 se concluye que el desplazamiento neto x12 es positivo
cuando el resorte esta comprimido.
En el caso de un resorte lineal la funcion constitutiva responde a la Ley
de Hooke [2], pag. 640:

F = k x12 , (f = (ea )) (2.7)

donde k es una constante positiva que se conoce como la constante de rigidez


del resorte. Entonces, sustituyendo x12 = ea , F = f y F = k x12 en (2.2)
y suponiendo que x12 (0) = 0, se encuentra que la energa almacenada en el
resorte esta dada como:
Z x12
1
E= k x12 dx12 = k x212
0 2

2.2.2. Sistemas mecanicos rotativos

Almacenamiento de flujo

En la figura 2.5 se muestra un cuerpo rgido (sin flexibilidad) que gira


con velocidad angular 12 (12 = e, esfuerzo) bajo el efecto de un par T
(T = f , flujo). Se supone que no existe friccion entre el cuerpo y el medio
que lo rodea. Los sentidos mostrados para el par y la velocidad angular son
los sentidos que se definen como positivos para este tipo de componente de
sistema. De acuerdo a la Segunda Ley de Newton [2], pag. 122:

T ! 12
2
Eje de rotacin

Figura 2.5. Un cuerpo rgido rotativo de inercia I como almacenador de flujo en


sistemas mecanicos rotativos.

T = I (2.8)

donde = ddt12 es la aceleracion angular del cuerpo e I es el momento de


inercia (constante positiva). El momentum angular h se define de la siguiente
manera conveniente:
2.2 Almacenadores de energa 23

h = I12 (2.9)

porque integrando (2.8) y (2.9) se encuentra que el momentum angular es la


acumulacion de flujo (h = fa ) porque se puede escribir:
Z t
h= T dt + h(0)
0

A partir de (2.9) se concluye que la funcion constitutiva es:


1
12 = (h) = h, (e = (fa ))
I
Entonces, sustituyendo 12 = e, h = fa y 12 = h/I en (2.3) y suponiendo
que h(0) = 0, se encuentra que la energa almacenada esta dada como:
Z h
1 1 2 1 2
E= h dh = h = I12
0 I 2I 2

lo cual constituye la expresion bien conocida para la energa cinetica.

Almacenamiento de esfuerzo

En la figura 2.6 se muestra un resorte que se deforma (mediante una flexion


angular) a una velocidad 12 (12 = e, esfuerzo) bajo el efecto de un par T
(T = f , flujo). Notese que aunque el par T se aplica en el extremo 1 del resorte,
debe considerarse que un par del mismo valor y de sentido contrario aparece
en el extremo 2 del resorte para que sea posible la deformacion. Ademas,
12 = 1 2 con 1 y 2 las velocidades de los extremos 1 y 2 del resorte,
respectivamente. Los sentidos mostrados para la fuerza y las velocidades son
los que se definen como positivos para este tipo de componente de sistema.
Se supone que el resorte no tiene momento de inercia (o masa) y que la
deformacion no es permanente ni produce calor. El almacenamiento de energa
en un resorte se realiza mediante el desplazamiento angular neto del resorte
respecto de su estado nominal. El estado nominal del resorte puede ser definido
como aquel en el cual el resorte no esta flexionado en ni en sentido horario
ni antihorario, pero en algunos casos tambien puede ser definido como aquel
en el cual el sistema mecanico completo esta en reposo aunque el resorte este
flexionado en esa situacion de reposo. Por tanto, la acumulacion de esfuerzo
se define como el desplazamiento angular neto (ea = 12 ):

Z t
12 = 12 dt + 12 (0) (2.10)
0

donde 12 = 1 2 con 1 y 2 las posiciones angulares de los extremos 1 y


2 del resorte, respectivamente. De acuerdo al sentido de la velocidad 12 que
24 2 Modelado matematico de sistemas fsicos

se ha definido en la figura 2.6 se concluye que el desplazamiento angular neto


12 es positivo cuando el resorte se flexiona de modo que 1 > 2 .
En el caso de un resorte lineal, la funcion constitutiva responde a la Ley
de Hooke:

T = k 12 , (f = (ea )) (2.11)

donde k es una constante positiva que se conoce como la constante de rigidez


torsional del resorte. Entonces, sustituyendo 12 = ea , T = f y T = k 12 en
(2.2) y suponiendo que 12 (0) = 0, se encuentra que la energa almacenada en
el resorte esta dada como:
Z 12
1 2
E= k 12 d12 = k 12
0 2

2.2.3. Sistemas electricos

Almacenamiento de esfuerzo

En la figura 2.7 se muestra un inductor a traves del cual circula una corrien-
te electrica i (i = f , flujo) bajo el efecto de un voltaje v12 (v12 = e, esfuerzo)
aplicado entre sus extremos. Se supone que no existen efectos parasitos, es
decir, el inductor no tiene resistencia electrica interna ni existe capacitancia
entre sus espiras. Los sentidos mostrados para la corriente electrica y el voltaje
son los sentidos que se definen como positivos para este tipo de componente
de sistema.
Faraday fue el primero en darse cuenta de que un inductor (y en general
cualquier circuito electrico suficientemente largo, dado que un inductor es un
conductor electrico arrollado sobre un nucleo) tiene propiedades analogas a
las que tiene el momentum en sistemas mecanicos. Lo que Faraday llamo el

! 12
T !1 !2 T
1 2

Figura 2.6. Un resorte como almacenador de esfuerzo en sistemas mecanicos rota-


tivos.

i
1 2
+
v 12

Figura 2.7. Un inductor como almacenador de esfuerzo en sistemas electricos.


2.2 Almacenadores de energa 25

momentum electrodinamico es mas conocido actualmente como el flujo con-


catenado y es igual al flujo magnetico que es encerrado por el inductor.
Faraday encontro que el flujo concatenado es proporcional a la corriente i que
fluye a traves del inductor y a una constante positiva L que depende de la
forma geometrica en que el conductor esta arrollado para formar el inductor.
La constante L recibe el nombre de inductancia. Por tanto, se puede escribir:

= Li (2.12)

El flujo concatenado determina el voltaje que se produce en los extremos de


un inductor mediante lo que hoy se conoce como la Ley de Faraday [2], pag.
606, [3], pag. 325:
d di
v12 = =L (2.13)
dt dt
Esto significa que el flujo concatenado representa la acumulacion de voltaje o
esfuerzo ( = ea ).
Z t
= v12 dt + (0)
0

Por tanto, a partir de la expresion en (2.12) se concluye que:


1
i = () = , (f = (ea ))
L
Entonces, sustituyendo i = f , = ea e i = /L en (2.2) y suponiendo que
(0) = 0, se encuentra que la energa almacenada esta dada como:
Z
1 1 2 1
E= d = = Li2 (2.14)
0 L 2L 2
lo cual constituye la expresion bien conocida para la energa magnetica alma-
cenada en un inductor.

Almacenamiento de flujo

Un capacitor se forma donde quiera que se encuentren dos conductores


electricos con potenciales electricos diferentes, separados por un material no
conductor a una distancia suficientemente pequena como para que se genere
un campo electrico entre ellos. Cada uno de los conductores electricos recibe
el nombre placa. En la figura 2.8 se muestra un capacitor a traves del cual
circula una corriente electrica i (i = f , flujo) bajo el efecto de un voltaje v12
(v12 = e, esfuerzo) aplicado entre sus terminales. Se supone que no existen
efectos parasitos, es decir que no existe corriente de fuga entre las placas del
capacitor y que no existen efectos inductivos debidos a las placas del capa-
citor. Debido a la diferencia de potencial que existe entre los conductores se
26 2 Modelado matematico de sistemas fsicos

producira una acumulacion de carga electrica. Se usa la letra q para repre-


sentar dicha carga electrica, la cual es igual pero de signo contrario en cada
uno de los conductores. Con el fin de cuantificar la cantidad de carga electrica
que puede ser almacenada, se define la capacitancia C (constante positiva)
del siguiente modo [3], pag. 121:
q
C= (2.15)
v12
La capacitancia C depende de la forma geometrica y la cercana de los con-
ductores (placas), as como de las propiedades dielectricas del material no
conductor colocado entre ellos. La corriente electrica se define a partir de la
carga electrica del siguiente modo:
dq
i= (2.16)
dt
Por tanto, la carga electrica representa la acumulacion de flujo (de corriente
electrica) (q = fa ):
Z t
q= i dt + q(0)
0

A partir de la expresion en (2.15) se concluye que


1
v12 = (q) = q, (e = (fa ))
C
Entonces, sustituyendo v12 = e, q = fa y v12 = q/C en (2.3) y suponiendo
que q(0) = 0, se encuentra que la energa almacenada esta dada como:
Z q
1 1 2
E= q dq = q
0 C 2C
lo cual constituye la expresion bien conocida para la energa electrica alma-
cenada en un capacitor.

i
1 2

+
v 12

Figura 2.8. Un capacitor como almacenador de flujo en sistemas electricos.


2.3 Disipadores de energa 27

2.3. Disipadores de energa


Un disipador es un componente que basicamente convierte la energa en
otra forma de energa (generalmente termica) la cual no es recuperable por el
sistema. A diferencia de los almacenadores de energa, la disipacion de energa
solo se realiza mediante un unico proceso. As, un disipador es un componente
cuya funcion constitutiva relaciona de manera estatica (sin integrales de por
medio) a las variables generalizadas de esfuerzo y de flujo:

e = (f )

En este caso no hay energa almacenada y solo se puede hablar de que la


potencia instantanea que se disipa esta dada por el producto de las variables
generalizadas de esfuerzo y flujo:

w = ef (2.17)

A continuacion se estudian los componentes disipadores de energa en sistemas


de diferente naturaleza.

2.3.1. Sistemas mecanicos traslacionales

Cualquier objeto mecanico que requiere de la aplicacion permanente de


una fuerza para poder mantener un valor de velocidad presenta efectos di-
sipativos. Normalmente la disipacion de potencia ocurre porque la energa
cinetica esta siendo convertida en energa termica por efecto de la friccion, la
cual aparece siempre que dos cuerpos hacen contacto mientras existe movi-
miento relativo entre ellos. La funcion constitutiva de un disipador mecanico
general esta dada como:

v12 = (F )

donde v12 (e, esfuerzo) es la velocidad relativa entre los cuerpos y F (f , flujo)
es la fuerza aplicada. Un caso particular muy importante de friccion es la
friccion viscosa, la cual esta representada por una funcion constitutiva lineal
de la forma:
1
v12 = F, friccion viscosa (2.18)
b
donde b es una constante positiva conocida como el coeficiente de friccion
viscosa. Este tipo de friccion ocurre, por ejemplo, cuando una placa plana
y llena de orificios se desplaza dentro de una camara cerrada llena de aire,
como se muestra en la figura 2.9. Debido a que el aire debe fluir a traves de
los orificios conforme la placa se mueve a velocidad v12 , es necesario aplicar
una fuerza F para mantener la velocidad del movimiento. Ademas, v12 =
v1 v2 donde v1 y v2 son las velocidades de los extremos 1 y 2 del dispositivo,
28 2 Modelado matematico de sistemas fsicos

respectivamente. Los sentidos de la fuerza y las velocidades mostrados en la


figura 2.9 son los definidos como positivos. Aunque el dispositivo mostrado en
la figura 2.9 puede no estar colocado fsicamente entre dos cuerpos que hacen
contacto, la friccion viscosa generalmente esta presente y es comun tomarla
en cosideracion. De acuerdo a (2.17), la potencia disipada por efecto de la
friccion viscosa esta dada como:
1 2 2
w= F = bv12
b

v 12

v1 F
F

1
2
v2

Figura 2.9. La friccion viscosa se produce como resultado de la resistencia al flujo


del aire a traves de los orificios.

Tambien existen otros tipos de friccion que con frecuencia aparecen en la


practica. Dos de ellas son la friccion estatica y la friccion de Coulomb. Las
funciones constitutivas en cada caso son:

F = Fs |v12 =0 , friccion estatica (2.19)



+1, si v12 > 0
F = Fc signo(v12 ), signo(v12 ) = , friccion de Coulomb
1, si v12 < 0
(2.20)

La friccion estatica representa una fuerza que tiende a prevenir el movimiento


solo en el momento en que este esta a punto de iniciar. Esta es la razon por
la que en la ecuacion (2.19) la contante Fs se evalua en v12 = 0. La friccion
de Coulomb, en cambio, solo aparece cuando el movimiento se esta realizando
(v12 6= 0) y es constante para velocidades del mismo signo. En la figura 2.10 se
muestran graficamente las funciones constitutivas en (2.18), (2.19) y (2.20).
Dado que las fuerzas de friccion estatica y de Coulomb no tienden a ce-
ro cuando la velocidad tiende a cero, estas fricciones son las responsables
de algunos problemas en sistemas de control de posicion: la diferencia entre
la posicion que se desea alcanzar y la posicion realmente alcanzada por el
mecanismo es diferente de cero, lo que se conoce como un error en estado
2.3 Disipadores de energa 29

F F F
Fs Fc
b

v 12 v 12 v 12

Fs Fc

Figura 2.10. Funciones constitutivas definidas en (2.18), (2.19) y (2.20).

estacionario diferente de cero. Por otro lado, dado que las fricciones estatica
y de Coulomb tienen funciones constitutivas no lineales y discontinuas, no
pueden ser manejadas usando tecnicas de control por sistemas lineales ni por
las tecnicas de control para sistemas no lineales suaves. Esta es la razon
por las que con frecuencia no son consideradas en el modelado de sistemas.
Sin embargo, hay que tener presente que en cualquier situacion experimental
se observaran los efectos de estas dos fricciones. Se sugiere consultar [4] si se
desea conocer algunos metodos para medir los parametros de distintos tipos
de friccion.

2.3.2. Sistemas mecanicos rotativos

Los disipadores en sistemas mecanicos rotativos (vease la figura 2.11) son


identicos a los disipadores en sistemas mecanicos traslacionales. La unica di-
ferencia es que las variables generalizadas de esfuerzo y flujo estan expresadas
en terminos de velocidad angular 12 (12 = e, esfuerzo) y par T (T = f ,
flujo):
1
12 = T, friccion viscosa (2.21)
b
T = Ts |12 =0 , friccion estatica

+1, si 12 > 0
T = Tc signo(12 ), signo(12 ) = , friccion de Coulomb
1, si 12 < 0

2.3.3. Sistemas electricos

El componente disipador en sistemas electricos es aquel en el cual es ne-


cesario aplicar un voltaje v12 (v12 = e, esfuerzo) entre sus terminales para
mantener el flujo de una corriente i (i = f , flujo) a traves de el. La funcion
constitutiva correspondiente relaciona de manera estatica estas dos variables
30 2 Modelado matematico de sistemas fsicos

T !1 !2 T

! 12

Figura 2.11. Un disipador en sistemas mecanicos rotativos.

y esta definida por la Ley de Ohm [2], pag. 530, en el caso de que el disipador
sea lineal:

v12 = iR (2.22)

donde R es una constante positiva conocida como la resistencia electrica del


disipador. En la figura 2.12 se muestra una resistencia electrica por la que
fluye una corriente i y se aplica un voltaje v12 . Los sentidos mostrados son los
definidos como positivos. De acuerdo a w = ef , la potencia disipada en una
resistencia electrica esta dada como:
1 2
w = i2 R = v
R 12

v 12

i
1 2
+

Figura 2.12. Una resistencia como disipador en sistemas electricos.

2.4. Fuentes de energa


Las fuentes de energa pueden ser de dos tipos: fuentes de esfuerzo (e) y
fuentes de flujo f . En las figuras 2.13(a) y 2.13(b) se muestran ambos tipos
de fuentes y los sentidos definidos como positivos para el esfuerzo y el flujo.
Tambien se muestran dos dibujos en los que especifica que una fuente de
esfuerzo (o de flujo) entrega un esfuerzo (o un flujo) que es independiente
(constante) del flujo (o esfuerzo) a traves de la fuente. Mas aun, cuando la
potencia w = ef es positiva, entonces w es la potencia que la fuente entrega
a los otros componentes del sistema; cuando la potencia w = ef es negativa,
entonces w es la potencia que la fuente recibe desde los otros componentes del
sistema.
2.4 Fuentes de energa 31

f
e
e1
+
e1 Recibe Entrega
potencia potencia

f
(a)
f
f1
+
f1 Recibe Entrega
e potencia potencia

e
(b)

Figura 2.13. Fuentes de esfuerzo y de flujo.

2.4.1. Sistemas mecanicos traslacionales

Una fuente de fuerza es una fuente de flujo, por lo que la fuente entrega
una fuerza cuyo valor es independiente de la velocidad (esfuerzo) del compo-
nente del sistema sobre el cual se esta aplicando dicha fuerza. Una fuente de
velocidad es una fuente de esfuerzo, por lo que la velocidad que produce es
independiente de la fuerza (flujo) ejercida sobre el componente del sistema
correspondiente. Claramente es mucho mas facil visualizar lo que es una fuen-
te de fuerza que una fuente de velocidad. Sin embargo, algunos fenomenos
pueden ser modelados de manera conveniente como fuentes de velocidad.

2.4.2. Sistemas mecanicos rotativos

Las fuentes se definen como en el caso de sistemas mecanicos traslacionales,


pero en terminos de par (flujo) y velocidad angular (esfuerzo).

2.4.3. Sistemas electricos

Una fuente de corriente electrica es una fuente de flujo, por lo que la fuente
entrega una corriente electrica cuyo valor es independiente del voltaje (esfuer-
zo) entre sus terminales. Una fuente de voltaje es una fuente de esfuerzo, por
lo que el voltaje entre sus terminales es independiente de la corriente electrica
a traves de ella. Tal como sucede en los sistemas mecanicos, es mas facil visua-
lizar una clase de fuentes: el concepto de fuente de voltaje es mas claro que el
de una fuente de corriente electrica. Sin embargo, el uso de fuentes de corrien-
te es un artificio muy util para modelar algunos efectos que se presentan, por
ejemplo, en circuitos electronicos.
32 2 Modelado matematico de sistemas fsicos

2.5. Convertidores
Los convertidores son componentes que simplemente permiten que la
energa fluya a traves de ellos sin almacenarla ni disiparla. Estos componentes
estan conectados a traves de dos puertos (vese la figura 2.14). Cada puerto
esta definido por una variable generalizada de esfuerzo y una de flujo. El pa-
pel de los convertidores es modificar las variables de esfuerzo y de flujo en
el segundo puerto respecto de las variables de esfuerzo y de flujo que existen
en el primer puerto. Este proceso es realizado de manera que la energa en el
segundo puerto es igual a la energa en el primer puerto. Esos componentes
se pueden clasificar en dos tipos: i) los transformadores, en los cuales las va-
riables de esfuerzo y de flujo en ambos puertos son de la misma naturaleza e
ii) los adaptadores, en lo cuales las variables de esfuerzo y flujo en un puerto
son de naturaleza diferente a las del otro puerto.

f1 f2

Puerto 1 Convertidor Puerto 2


e1 e2

Figura 2.14. Un convertidor tiene dos puertos.

2.5.1. Transformadores

Sistemas electricos

Un transformador electrico esta formado por dos inductores (conduc-


tores electricos) enrollados firmemente sobre un mismo nucleo de material
ferromagnetico (vease la figura 2.15). Esto significa que los inductores estan
magneticamente acoplados pero electricamente aislados.
Cada inductor define un puerto. En el puerto 1, v1 representa la variable
de esfuerzo e i1 representa la variable de flujo. En el puerto 2, v2 representa
la variable de esfuerzo e i2 representa la variable de flujo. Las direcciones
indicadas representan los sentidos definidos como positivos de estas variables.
El punto colocado en la parte superior de cada inductor se usa como una
convencion para indicar que los inductores se enrollan en la misma direccion.
Si no fuera este el caso entonces los puntos se colocaran en extremos opuestos
de los inductores. El inductor conectado al puerto 1 consta de n1 vueltas y el
inductor conectado al puerto 2 consta de n2 vueltas.
2.5 Convertidores 33

Como los inductores estan acoplados magneticamente, el flujo concatenado


por el inductor 1, 1 , y por el inductor 2, 2 , dependen ahora de las corrientes
en ambos inductores:

1 = L1 i1 + M12 i2 , (2.23)
2 = M21 i1 + L2 i2 (2.24)

donde L1 , L2 son las inductancias de los inductores 1 y 2, mientras que M12


y M21 son las inductancias mutuas existentes entre ambos circuitos. Siempre
se cumple que M12 = M21 = M . Los signos positivos en las expresiones
anteriores son debidos a que las orientaciones de las corrientes son tales que
la corriente positiva entra a los arrollamientos por los extremos marcados con
un punto. Despejando i2 de (2.23) y sustituyendo en (2.24) se obtiene:

L2 L1 L2
2 = 1 + M i1 (2.25)
M M

Se define el coeficiente de acoplamiento como:


M
k=
L1 L2
Si los circuitos estan completamente desacoplados entonces k = 0, pero si
los dos circuitos estan perfectamente acoplados de modo que todo el flujo
que es encerrado por el inductor 1 tambien es encerrado por el inductor 2,
entonces k = 1. Este caso es obtenido con muy buen grado de aproximacion
en la practica si el nucleo sobre el cual se enrollan los dos inductores es de
material ferromagnetico con un valor grande de permeabilidad
magnetica .
Suponiendo que este es el caso, es decir que M = L1 L2 , entonces (2.25) se
convierte en:
r
L2
2 = 1 (2.26)
L1

i2
+
v2

n2
i1

+ n1
v1

Figura 2.15. Transformador electrico.


34 2 Modelado matematico de sistemas fsicos

Por otro lado, dividiendo (2.24) entre (2.23), con M12 = M21 = M , y usando
(2.26):
r
2 M i1 + L2 i2 L2
= =
1 L1 i1 + M i2 L1
A partir de esto se puede escribir:

i2 L1 L2 M
= q
i1 L2 L L1 M
2

r
L1 ( L1 L2 M )
L2 L1
= = (2.27)
L1 L2 M L2

La inductancia de cada circuito esta dada como:


n21 A
L1 =
l
n22 A
L2 =
l
donde A, l y son, respectivamente, el area, la longitud media y la permea-
bilidad magnetica del nucleo. Por tanto
r
L1 n1
= (2.28)
L2 n2

Usando esto y (2.13) se obtiene, de (2.26):


n2
v2 = v1
n1

y de (2.27):
n1
i2 = i1
n2
Lo cual significa que la potencia en ambos puertos es igual porque:
n2 n1
w2 = v2 i2 = v1 i1 = v1 i1 = w1
n1 n2

Sistemas mecanicos traslacionales

En la figura 2.16 se muestra un transformador mecanico traslacional as co-


mo las variables definidas y los sentidos definidos positivos de las mismas. Se
trata de una palanca con brazos de longitud a y b. Las posiciones x1 y x2 se
obtienen por simple geometra:
2.5 Convertidores 35

x1 = a sin(), x2 = b sin()

Derivando respecto al tiempo y dividiendo ambos resultados se obtiene la


relacion entre esfuerzos:
b
v2 = v1
a
La relacion entre las fuerzas (flujos) en cada puerto se obtiene usando el
principio del trabajo virtual:

F1 x1 = F2 x2
x1 = a sin(), x2 = b sin()
a
F2 = F1
b
Notese que la potencia en ambos puertos es igual:
b a
w2 = v2 F2 = v1 F1 = F1 v1 = w1
a b

F2

b
v2

v1

F1

Figura 2.16. Transformador mecanico traslacional.

Sistemas mecanicos rotativos

En la figura 2.17 se muestran dos ruedas dentadas de radios r1 y r2 unidas,


cada una, a un eje rotativo. La rueda de radio r1 tiene n1 dientes mientras que
la rueda de radio r2 tiene n2 dientes. En la figura 2.17 tambien se muestran
los sentidos definidos como positivos de los pares y las velocidades angulares
36 2 Modelado matematico de sistemas fsicos

en cada rueda. El hecho de que las ruedas sean dentadas evita que las ruedas
puedan patinar. Esto asegura que la longitud de arco de crculo s generado
por un angulo 1 descrito en el eje 1 sea igual a la longitud de arco generado
por un angulo 2 en el eje 2. Existe una relacion geometrica que relaciona al
radio de un crculo, el angulo descrito por el mismo y la longitud del arco de
crculo generado. Aplicando esta relacion en ambos ejes se tiene:

s = 1 r1 , s = 2 r2 (2.29)

donde 1 y 2 deben estar dados en radianes. De lo anterior se obtiene:

1 r1 = 2 r2 (2.30)

T1 T2
1 s 2
!1 r1 r2 !2
n1
n2
F

Figura 2.17. Caja de engranes.

Por otro lado, se sabe que el paso de los engranes (ancho de cada diente)
es igual en ambos ejes, pues esto es necesario para que dichos dientes se
adapten correctamente al girar. Esto significa que:

p1 = n1 , p2 = n2
p1 = 2r1 , p2 = 2r2

donde p1 y p2 representan los permetros de cada una de las ruedas dentadas.


Combinando estas expresiones se tiene:
r1 n1
= (2.31)
r2 n2

Combinando (2.30) y (2.31):


n2
1 = 2
n1
Derivando respecto al tiempo se obtiene:
2.5 Convertidores 37
n2
1 = 2 (2.32)
n1
donde 1 y 2 son las velocidades angulares de cada rueda. Por otro lado, la
fuerza F aplicada en el punto donde hacen contacto las ruedas es igual para
ambas. Esta fuerza satisface:

T1 = F r1 , T2 = F r2

donde T1 y T2 son los pares aplicados a cada eje. Despejando F e igualando:


r1 n1
T1 = T2 = T2 (2.33)
r2 n2
Usando (2.33) y (2.32) se encuentra que la potencia en ambos puertos es igual:
n1 n2
w1 = T1 1 = T2 2 = T2 2 = w2
n2 n1

2.5.2. Adaptadores

Sistemas mecanicos

Considere el sistema pinon-cremallera mostrado en la figura 2.18. El puerto


1 esta definido en terminos de variables rotativas: la velocidad angular 1 es
el esfuerzo y el par T1 es el flujo, mientras que el puerto 2 esta definido en
terminos de variables de traslacion: la velocidad v2 es el esfuerzo y la fuerza
F2 es el flujo. Por definicion, el par T1 y la fuerza F2 se relacionan a traves
de:

T1 = rF2 (2.34)

donde r es el radio del pinon, mientras que la velocidad angular 1 y la


velocidad v2 se relacionan a traves de (vease (2.29)):

v2 = r1 (2.35)

Por tanto, la potencia en ambos puertos es igual:


1
w1 = T1 1 = rF2 v2 = F2 v2 = w2
r
Los sentidos mostrados en la figura 2.18 son los definidos como positivos.

Sistemas electromecanicos

En la figura 2.19 se muestra una espira cuadrada de area A = l2 colocada


dentro de un campo magnetico B. Por la espira circula una corriente electrica
i, en el sentido indicado, por efecto de una fuente de voltaje externa de valor E.
38 2 Modelado matematico de sistemas fsicos
!1

r
T1

F2 v2

Figura 2.18. Pinon-cremallera.

N S

v+

R
L
i
+
E
(a) Vista superior.
F
B

N S

F
(b) Vista frontal.

Figura 2.19. Motor electrico de CD.

La resistencia R y la inductancia L mostradas en la figura 2.19(a) representan


la resistencia del cobre y la inductancia de la espira. La fuerza que ejerce el
campo magnetico sobre una corriente electrica de longitud l esta dada como
[2], pag. 541:
2.5 Convertidores 39

F = ilu B (2.36)

donde u es un vector unitario en el mismo sentido de la corriente electrica y


se usa la barra arriba de las variables para indicar que se trata de vectores.
El smbolo representa el producto vectorial. Por tanto, bajo la situacion
mostrada en la figura 2.19(b), es decir cuando = 90 , el campo magnetico
ejerce sobre los lados izquierdo y derecho de la espira la fuerza:

F = ilB

en el sentido indicado. Esto significa que sobre el eje de la espira se ejerce un


par de valor:
l
T = 2 F = iBl2 = iBA
2
donde se ha considerado que el par debido a la fuerza en cada lado es lF/2
(fuerza por radio) y que hay dos fuerzas aplicadas de la misma magnitud: una
aplicada sobre el lado izquierdo y otra sobre el lado derecho de la espira. El
lector puede verificar que, de acuerdo a (2.36), las fuerzas sobre los lados de
la espira que estan atras y adelante no producen ningun par de giro. Todo
lo anterior significa que la espira gira con una velocidad angular = , es
decir, en sentido contrario al definido para en la figura 2.19(b) donde es el
angulo formado por las direcciones del campo magnetico y la perpendicular
a la espira. De acuerdo a la Ley de Faraday [3], pag. 325, este movimiento
induce un voltaje v en las terminales de la espira el cual esta dado de acuerdo
a (2.13), es decir:
d
v=
dt
donde es el flujo magnetico concatenado por la espira el cual esta dado por:

= BA cos()

Por tanto, usando estas dos expresiones se encuentra:

v = BA sin() = BA sin()

Notese que, de acuerdo a la Ley de Lenz [3], pag. 327, el voltaje inducido v
tiene una polaridad tal (vease la figura 2.19(a)) que se opone a la causa que
lo produce la cual en este caso es, a fin de cuentas, la corriente que circula i.
Ahora suponga que se colocan varias espiras con diferentes inclinaciones, de
manera que un conmutador mecanico automaticamente conecte y desconecte
las espiras de tal modo que siempre este conectada solamente la espira para
la cual = 90 . Entonces, el voltaje en las terminales del conjunto esta dado
como:

v = BA
40 2 Modelado matematico de sistemas fsicos

Lo que se acaba de describir es el funcionamiento de un motor electrico de CD


(corriente directa). Sean el voltaje v y la corriente i las variables de esfuerzo
y flujo, respectivamente, del puerto 1 y sean la velocidad angular y el par T
las variables de esfuerzo y flujo, respectivamente, del puerto 2. Las relaciones
entre las variables de ambos puertos estan dadas por:

v = BA (2.37)
1
i= T
BA
Si se considera que en el puerto 1 se aplica un par T a una velocidad ,
produciendo en el puerto 2 un voltaje v y una corriente electrica i, entonces
se tiene un generador electrico de CD y ambas expresiones en (2.37) aun son
validas. Notese que en cualquiera de estos casos, la potencia en ambos puertos
es igual:
1
w1 = vi = T BA = T = w2
BA
En situaciones mas generales se acostumbra escribir las expresiones en (2.37)
del siguiente modo:

v = ke (2.38)
T = km i (2.39)

donde ke > 0 y km > 0 se conocen, respectivamente, como la constante de


fuerza contra electromotriz y la constante de par. Estas constantes se intro-
ducen para tomar en consideracion la presencia de varias espiras en serie y
otras variantes en la construccion de motores y generadores de CD. Se puede
usar el hecho de que la potencia en ambos puertos es igual:
1
w1 = vi = ke T = T = w2
km
para mostrar que ke = km en cualquier motor (generador) de CD. Sin embar-
go, hay que tener cuidado con las unidades: ke = km se cumple siempre que
estas constantes se expresen en el sistema internacional de unidades (metro-
kilogramo-segundo).

Sistemas electromecanicos: fuerza debida a un campo magnetico

En la figura 2.20 se muestra una barra de material ferromagnetico colocada


a una distancia x de un electroiman. El electroiman consiste de un inductor
arrollado sobre un nucleo del mismo material ferromagnetico que la barra. Por
el inductor circula una corriente electrica i por efecto de un voltaje v aplicado
en sus terminales.
La inductancia L(x) es dependiente de la posicion x de la barra debido a lo
siguiente. De acuerdo a (2.12), el flujo magnetico esta dado como el producto
2.5 Convertidores 41
x

i
+
F
v

Figura 2.20. Fuerza debida un campo magnetico.

de la inductancia y la corriente electrica = L(x)i. Por otro lado, si la barra


se aproxima al nucleo entonces el espacio entre ambos disminuye. Como el aire
presenta mayor resistencia al paso del flujo magnetico que la resistencia que
presenta un material ferromagnetico, entonces el flujo magnetico aumenta al
disminuir x. Si la corriente electrica se mantiene constante mientras se reduce
x entonces, de acuerdo a = L(x)i un aumento del flujo solo puede ser
debido a un aumento en la inductancia L(x), es decir, que la inductancia
cambia al cambiar x.
Por efecto del campo magnetico generado por la corriente i, la barra recibe
una fuerza de atraccion F hacia el nucleo del electroiman. A continuacion
se obtiene una expresion para esta fuerza. Suponga que la barra sufre un
desplazamiento dx. El trabajo mecanico debido a este desplazamiento es:

dEM = F dx (2.40)

De acuerdo a (2.14), la energa almacenada en el campo magnetico esta dada


como:
1
Em = L(x)i2 (2.41)
2
Como la corriente se mantiene constante y solo hay un cambio en la posicion
de la barra, entonces el cambio en la energa magnetica esta dado por:
1 2
dEm = i dL(x) (2.42)
2
Los cambios en las energas mecanica y magnetica deben ser suministrados
por la fuente de voltaje conectada a la inductancia, es decir:

dEv = dEm + dEM (2.43)

donde dEv es el trabajo suministrado por la fuente de voltaje. Este trabajo


debe ser realizado compensando el voltaje inducido en la inductancia el cual,
de acuerdo a (2.13) y = L(x)i, esta dado como:
42 2 Modelado matematico de sistemas fsicos

d dL(x)
v= =i
dt dt
Por tanto:

dEv = vidt = i2 dL(x) (2.44)

Sustituyendo (2.42) y (2.44) en (2.43):


1 1
dEM = i2 dL(x) i2 dL(x) = i2 dL(x)
2 2
es decir, la mitad del trabajo realizado por la fuente de voltaje se dedica a
cambiar la energa magnetica y la otra mitad se dedica a realizar el trabajo
mecanico, es decir;

dEm = dEM (2.45)

Por otro lado, como el cambio en la energa magnetica solo se debe al cambio
en la posicion x, entonces se puede escribir:
Em
dEm = dx
x
Entonces, de acuerdo a esto, (2.40), (2.45) y (2.41) se concluye que:

Em 1 L(x)
F = = i2 (2.46)
x 2 x
El desarrollo aqu presentado se basa en las ideas reportadas en [5], cap. 5.

2.6. Ejemplos
Una vez que se han establecido las funciones constitutivas de cada ele-
mento de sistema se debe abordar el problema de conectar varios de estos
elementos para obtener el modelo matematico de sistemas mas o menos com-
plejos. La clave para interconectar los elementos de un sistema mecanico es
considerar que todos ellos se conectan mediante uniones rgidas. Esto significa
que la velocidad a ambos lados de una union es igual. Para ser mas claros, a
continuacion se presentan varios ejemplos.
Ejemplo 2.2 Considere el sistema masa-resorte-amortiguador mostrado en
la figura 2.21(a) donde se aplica una fuerza externa F (t) sobre el cuerpo de
masa m. Este sistema quiza sea el mas sencillo desde el punto de vista del
modelado, pero es muy importante desde el punto de vista de control porque
representa el comportamiento basico de los sistemas de control de posicion.
En la figura 2.21(b) se muestra el diagrama de cuerpo libre correspondien-
te. Notese que en cada union entre componentes existen dos fuerzas iguales
2.6 Ejemplos 43

aplicadas en sentidos contrarios. Esto es con el fin de satisfacer la Tercera


Ley de Newton [2], pag. 88, que establece que a cada accion (del cuerpo A
sobre el cuerpo B) corresponde una reaccion (del cuerpo B sobre el cuerpo
A). Las ruedas debajo del cuerpo se usan para indicar que no existe friccion
con el suelo sobre el cual se apoya. Esto tambien significa que el efecto de la
gravedad no interviene. Sin embargo, equivalentemente se podra eliminar el
amortiguador colocado en el extremo derecho para ser sustituido por friccion
entre el cuerpo y el suelo. El modelado de la friccion entre el cuerpo y el sue-
lo se realiza de manera identica a como se considera el amortiguador en el
procedimiento que sigue.

K F (t) b
m

(a)
vK vm vb
F (t)
FK Fb
m
FK Fb
(b) Diagrama de cuerpo libre.

Figura 2.21. Sistema masa-resorte-amortiguador.

La nomenclatura utilizada es la siguiente:


vm = dxdtm , donde xm es la posicion del cuerpo.
vb = dx
dt , donde xb es la posicion del extremo movil del amortiguador.
b

dxK
vK = dt , donde xK es la posicion del extremo movil del resorte.
Usando la figura 2.21(b), as como (2.4), (2.7), (2.18) se obtienen las siguien-
tes expresiones:
dvm
masa: m = F (t) + FK Fb (2.47)
dt
resorte: KxK = FK (2.48)
amortiguador: bvb = Fb (2.49)

Notese que, de acuerdo a la convencion de signos mostrada en la figura 2.3, las


fuerzas que actuan sobre la masa m y que tienen el mismo sentido que vm en
la figura 2.21(b) aparecen con signo positivo en (2.47) y por esa misma razon
Fb aparece afectada por un signo negativo. Los signos a ambos lados de las
expresiones en (2.48) y (2.49) respetan las convenciones de signos definidas
en las figuras 2.4 y 2.9, respectivamente. Notese que uno de los extremos del
resorte y del amortiguador esta en reposo y que son los extremos moviles los
44 2 Modelado matematico de sistemas fsicos

que en las figuras 2.4 y 2.9 tienen una velocidad y una fuerza aplicadas en el
mismo sentido. Notese tambien que se ha definido:
dxK
vK = (2.50)
dt
Considerando que los diferentes elementos de sistema se conectan mediante
uniones rgidas, de acuerdo a la figura 2.21(b) se puede escribir:
vK = vm = vb (2.51)
De acuerdo a esto se concluye que se puede escribir:
xK = xm + c1 = xb + c2
donde c1 y c2 son dos constantes. Si se usa la convencion de definir xK = 0,
xm = 0 y xb = 0 como aquellos puntos ocupados por el extremo movil del
resorte, el centro del cuerpo de masa m y el extremo movil del amortiguador,
respectivamente, cuando el sistema esta en reposo con F (t) = 0, entonces se
puede decir que c1 = c2 = 0 y, por tanto:
xK = xm = xb
Usando estas relaciones, tambien se puede escribir (2.47), (2.48), (2.49) co-
mo:
d2 xm dxm
m +b + Kxm = F (t) (2.52)
dt2 dt
Esta ultima expresion es una ecuacion diferencial ordinaria, de segundo or-
den, lineal y de coeficientes constantes, que representa el modelo matematico
del sistema masa-resorte-amortiguador. Esto significa que si se conocen los
parametros m, b y K, as como las condiciones iniciales xm (0), dxdtm (0) y la
fuerza externa aplicada F (t) como una funcion del tiempo, entonces se puede
resolver dicha ecuacion diferencial para obtener la posicion xm (t) y la velo-
cidad dxdtm (t) del cuerpo como funciones del tiempo. Dicho de otro modo, se
puede conocer la posicion y la velocidad del cuerpo en cualquier instante de
tiempo presente o en el futuro, es decir, para todo t 0. Finalmente, cuando
se estudia la solucion de las ecuaciones diferenciales es conveniente expresar
una ecuacion diferencial de manera que el coeficiente de la potencia mayor
sea igual a la unidad, es decir, es mas conveniente escribir (2.52) como:
b K 1
xm + xm + xm = F (t) (2.53)
m m m
d2 xm dxm
donde xm = dt2 y xm = dt .

Ejemplo 2.3 En la figura 2.22(a) se muestra un sistema masa-resorte-


amortiguador con un resorte y un amortiguador colocados en un mismo ex-
tremo del cuerpo de masa m. El objetivo de este ejemplo es mostrar que el
modelo matematico en este caso es identico al obtenido en el ejemplo previo.
La nomenclatura utilizada es la siguiente:
2.6 Ejemplos 45

v = dx
dt , donde x es la posicion del cuerpo.
v1 = dxdtK = dx
dt , donde xK = xb representan la posicion del extremo movil
b

del resorte y del amortiguador, respectivamente.


De acuerdo a la figura 2.22(b) y a (2.4), (2.7), (2.18), se obtienen las siguien-
tes expresiones:
dv
masa: m= F (t) + FK + Fb (2.54)
dt
resorte: KxK = FK
amortiguador: bv1 = Fb

m F(t)

(a)
v1 v
FK
FK
Fb m F(t)
Fb

v1
(b) Diagrama de cuerpo libre.

Figura 2.22. Sistema masa-resorte-amortiguador.

Notese que, de acuerdo a la convencion de signos mostrada en la figura


2.3, todas las fuerzas en (2.54) aparecen afectadas por un signo positivo porque
tienen el mismo sentido que v en la figura 2.22(b). Por otro lado, al existir
una union rgida y de acuerdo a los sentidos definidos en la figura 2.22(b) se
tiene que:

v = v1 (2.55)

Del mismo modo a como se hizo en el ejemplo previo, si x = 0, xK = 0 y


xb = 0 se definen, respectivamente, como el centro del cuerpo m y el extremo
movil del resorte y del amortiguador cuando el sistema completo esta en reposo
con F (t) = 0, entonces se puede escribir:

xK = xb = x (2.56)
46 2 Modelado matematico de sistemas fsicos

No es difcil darse cuenta que combinando las expresiones en (2.54) y usando


(2.56), (2.55) se obtiene:

b K 1
x + x + x = F (t)
m m m
2
donde x = ddt2x y x = dx
dt . Este modelo matematico es identico al mostrado en
(2.53) si se considera que x = xm .
Ejemplo 2.4 En la figura 2.23(a) se muestran dos cuerpos unidos por un
resorte cuando se aplica una fuerza externa F (t) sobre el cuerpo de la izquier-
da. Esta situacion representa el caso practico en el que el cuerpo 1 transmite
movimiento al cuerpo 2 pero ambos cuerpos estan conectados mediante una
pieza mecanica que presenta flexibilidad. Esta flexibilidad no es introducida
de manera intencional sino que es un problema no deseado que aparece debido
a la rigidez finita del material con el que esta hecha la pieza mecanica que
une a los cuerpos 1 y 2. Con frecuencia es muy importante estudiar cual es
el efecto de esta flexibilidad en el desempeno del sistema de control y por eso
debe ser tomada en consideracion durante el modelado. Los amortiguadores
se introducen para considerar el efecto de la friccion de cada cuerpo con sus
soportes (o el suelo).

F (t)
K
m1 m2

b1 b2
(a)
v m1 vK v m2 v b2
F (t) F K1 K F b2
F b1
m1 m2
v b1 F b1 F K1 F K2 F K2 F b2

v1 v2
(b) Diagrama de cuerpo libre.

Figura 2.23. Dos cuerpos unidos por un resorte.

El diagrama de cuerpo libre correspondiente se muestra en la figura 2.23(b).


La nomenclatura utilizada es la siguiente:
vm1 = dxdtm1 , donde xm1 es la posicion del cuerpo 1.
vm2 = dxdtm2 , donde xm2 es la posicion del cuerpo 2.
vb1 = dxdtb1 , donde xb1 es la posicion del extremo movil del amortiguador
1.
2.6 Ejemplos 47

vb2 = dxdtb2 , donde xb2 es la posicion del extremo movil del amortiguador
2.
v1 = dx
dt , donde x1 es la posicion del extremo del resorte unido al cuerpo
1

1.
v2 = dx
dt , donde x2 es la posicion del extremo del resorte unido al cuerpo
2

2.
Usando la figura 2.23(b), as como (2.4), (2.7), (2.18), se obtienen las si-
guientes expresiones:
dvm1
masa 1: m1 = F (t) + Fb1 FK1 (2.57)
dt
dvm2
masa 2: m2 = FK2 Fb2 (2.58)
dt
resorte: KxK = FK1 = FK2
amortiguador 1: b1 vb1 = Fb1
amortiguador 2: b2 vb2 = Fb2

Las fuerzas que tienen el mismo sentido que vm1 y vm2 , y que actuan sobre
cada uno de los cuerpos, aparecen afectadas con un signo positivo y con un
signo negativo en caso contrario. Notese tambien que se ha definido:
dxK
vK = = v1 v2
dt
Considerando que todos los elementos del sistema se conectan mediante unio-
nes rgidas entonces, de acuerdo a la figura 2.23(b) se tiene que:

vm1 = vb1 = v1 (2.59)


vm2 = vb2 = v2

De acuerdo a esto, si se definen xm1 = 0, xm2 = 0, xb1 = 0, xb2 = 0,


x1 = 0, x2 = 0 como aquellos puntos ocupados por el centro del cuerpo 1, el
centro del cuerpo 2, el extremo movil del amortiguador 1, el extremo movil
del amortiguador 2, el extremo del resorte que esta unido al cuerpo 1 y el
extremo del resorte que esta unido al cuerpo 2, respectivamente, cuando todo
el sistema esta en reposo con F (t) = 0, entonces se concluye que:

xm1 = xb1 = x1 , (2.60)


xm2 = xb2 = x2

Por tanto, las expresiones en (2.57) y (2.58) se pueden escribir como:

dvm1
masa 1: m1 = F (t) + b1 vb1 KxK
dt
dvm2
masa 2: m2 = KxK b2 vb2
dt
48 2 Modelado matematico de sistemas fsicos

Usando (2.59) y (2.60) se obtiene:

d2 xm1 dxm1
masa 1: m1 2
= F (t) b1 KxK
dt dt
d2 xm2 dxm2
masa 2: m2 = KxK b2
dt2 dt
Por otro lado, de acuerdo al parrafo que sigue a (2.6) se tiene que xK =
x1 x2 , por lo que se puede escribir:

d2 xm1 dxm1
masa 1: m1 = F (t) b1 K(x1 x2 )
dt2 dt
d2 xm2 dxm2
masa 2: m2 = K(x1 x2 ) b2
dt2 dt
Finalmente, usando de nuevo (2.60) se obtiene que el modelo matematico
correspondiente esta dado por las dos siguientes ecuaciones diferenciales, las
cuales deben ser resueltas simultaneamente:
d2 xm1 b1 dxm1 K 1
masa 1: 2
+ + (xm1 xm2 ) = F (t)
dt m1 dt m1 m1
d2 xm2 b2 dxm2 K
masa 2: 2
+ (xm1 xm2 ) = 0
dt m2 dt m2
Estas dos ecuaciones diferenciales no pueden ser combinadas para obtener
una sola ecuacion diferencial, ya que las variables xm1 y xm2 son linealmente
independientes, es decir, no se cuenta con ninguna expresion algebraica que
relacione a estas variables.
Ejemplo 2.5 En la figura 2.24(a) se muestran dos cuerpos conectados a tres
resortes y un amortiguador. En este caso, el amortiguador representa la fric-
cion existente entre los dos cuerpos y, por esto, no puede ser sustituido por la
posible friccion existente entre cada cuerpo y el suelo (si no estuvieran colo-
cadas las ruedas debajo de cada cuerpo). El diagrama de cuerpo libre corres-
pondiente se muestra en la figura 2.24(b). La nomenclatura utilizada es la
siguiente:
x1 = dxdt , donde x1 es la posicion del cuerpo 1.
1

dx2
x2 = dt , donde x2 es la posicion del cuerpo 2.
vb1 = dxdtb1 , donde xb1 es la posicion del extremo del amortiguador que
esta conectado al cuerpo 1.
vb2 = dxdtb2 , donde xb2 es la posicion del extremo del amortiguador que
esta conectado al cuerpo 2.
v1 = dxdt , donde x es la posicion del extremo del resorte unido al cuerpo 1.
dy
v2 = dt , donde y es la posicion del extremo del resorte unido al cuerpo 2.
vK1 = dxdtK1 , donde xK1 es la posicion del extremo movil del resorte co-
nectado solo al cuerpo 1.
2.6 Ejemplos 49

F(t) x1 K2 x2
K1 K3
m1 m2

b
(a)
F K2 F K2
v K1 x1 x2
F K2 F K3
F K1 F K2 F K3
m1 v1 v2 m2
Fb
F K1 F(t) Fb v K3
Fb Fb
v b1 v b2
(b) Diagrama de cuerpo libre.

Figura 2.24. Sistema con dos cuerpos y tres resortes.

vK3 = dxdtK3 , donde xK3 es la posicion del extremo movil del resorte co-
nectado solo al cuerpo 2.
Usando la figura 2.24(b), as como (2.4), (2.7), (2.18), se obtienen las si-
guientes expresiones:

masa 1: m1 x1 = F (t) + FK1 FK2 Fb (2.61)


masa 2: m2 x2 = FK2 FK3 + Fb (2.62)
resorte entre cuerpos: K2 xK2 = FK2
resorte izquierdo: K1 xK1 = FK1
resorte derecho: K3 xK3 = FK3
amortiguador: b(vb1 vb2 ) = Fb

Considerando que todos los elementos del sistema se conectan mediante unio-
nes rgidas entonces, de acuerdo a la figura 2.24(b) se tiene que:

x1 = vK1 = v1 = vb1 (2.63)


x2 = vb2 = v2 = vK3

De acuerdo a esto, si se definen x1 = 0, x2 = 0, xb1 = 0, xb2 = 0, x = 0, y = 0,


xK1 = 0, xK3 = 0 como aquellos puntos ocupados por el centro del cuerpo 1,
el centro del cuerpo 2, el extremo del amortiguador conectado al cuerpo 1, el
extremo del amortiguador conectado al cuerpo 2, el extremo del resorte central
que esta unido al cuerpo 1, el extremo del resorte central que esta unido al
cuerpo 2, el extremo movil del resorte de la izquierda y el extremo movil del
50 2 Modelado matematico de sistemas fsicos

resorte de la derecha, respectivamente, cuando todo el sistema esta en reposo


con F (t) = 0, entonces se concluye que:

x1 = xK1 = x = xb1 (2.64)


x2 = xb2 = y = xK3

Por tanto, las expresiones en (2.61) y (2.62) se pueden escribir como:

masa 1: m1 x1 = F (t) + K1 xK1 K2 xK2 b(vb1 vb2 )


masa 2: m2 x2 = K2 xK2 K3 xK3 + b(vb1 vb2 )

Usando (2.63) y (2.64) se obtiene:

masa 1: m1 x1 = F (t) K1 x1 K2 xK2 b(x1 x2 )


masa 2: m2 x2 = K2 xK2 K3 x2 + b(x1 x2 )

Por otro lado, de acuerdo al parrafo que sigue a (2.6) se tiene que xK2 =
x1 x2 , por lo que se puede escribir:

masa 1: m1 x1 = F (t) K1 x1 K2 (x1 x2 ) b(x1 x2 )


masa 2: m2 x2 = K2 (x1 x2 ) K3 x2 + b(x1 x2 )

Finalmente, se obtiene que modelo matematico correspondiente esta dado por


las dos siguientes ecuaciones diferenciales, las cuales deben ser resueltas si-
multaneamente:
b K1 K2 1
masa 1: x1 + (x1 x2 ) + x1 + (x1 x2 ) = F (t)
m1 m1 m1 m1
b K3 K2
masa 2: x2 (x1 x2 ) + x2 (x1 x2 ) = 0
m2 m2 m2
Tal como ocurre en el ejemplo anterior, estas dos ecuaciones diferenciales no
pueden ser combinadas para obtener una sola ecuacion diferencial, ya que las
variables x1 y x2 son linealmente independientes, es decir, no se cuenta con
ninguna expresion algebraica que relacione a estas variables. Notese tambien
que los terminos correspondientes al resorte central y al amortiguador aparecen
con signo contrario en cada una de estas ecuaciones diferenciales. Esto es
debido a que la fuerza que produce el resorte central o el amortiguador sobre
el cuerpo 1 es en sentido contrario a la fuerza que ejerce sobre el cuerpo 2.
Ejemplo 2.6 En la figura 2.25(a) se muestra un cuerpo rotativo unido a dos
muros a traves de un resorte y un amortiguador. Sobre este cuerpo se aplica
un par externo T (t). En este caso, el amortiguador representa la friccion
existente entre el cuerpo y los rodamientos sobre los que se apoya. El resorte
representa la flexibilidad del eje o flecha del cuerpo giratorio. El diagrama de
cuerpo libre correspondiente se muestra en la figura 2.25(b). La nomenclatura
utilizada es la siguiente:
2.6 Ejemplos 51

= d
dt , donde es la posicion angular del cuerpo.
b = d dt , donde b es la posicion angular del extremo movil del amorti-
b

guador.
K = ddtK , donde K es la posicion angular del extremo movil del resorte.
Usando la figura 2.25(b), as como (2.8), (2.11), (2.21), se obtienen las si-
guientes expresiones:

cuerpo giratorio: I = T (t) + Tb TK (2.65)


resorte: KK = TK
amortiguador: bb = Tb

b K
I

T(t)
(a)

Tb Tb TK TK K

I
b
!b T(t)
(b) Diagrama de cuerpo libre.

Figura 2.25. Sistema masa-resorte-amortiguador rotativo.

Notese que los pares que se aplican sobre el cuerpo I y tienen el mismo
sentido que la velocidad angular , aparecen afectados por un signo positivo en
(2.65). En caso contrario aparecen afectados por un signo negativo, como es
el caso de TK . Considerando que todos los elementos del sistema se conectan
mediante uniones rgidas entonces, de acuerdo a la figura 2.25(b) se tiene que:

= b = K (2.66)

De acuerdo a esto, si se definen = 0, b = 0, K = 0 como las posiciones


angulares del cuerpo, el extremo movil del amortiguador y el extremo movil del
resorte, respectivamente, cuando todo el sistema esta en reposo con T (t) = 0,
entonces se concluye que:

= b = K (2.67)

Por tanto, las expresiones en (2.65) se pueden escribir como:


52 2 Modelado matematico de sistemas fsicos

I = T (t) + bb KK
= T (t) b K

Finalmente, se obtiene que el modelo matematico correspondiente esta dado


por la siguiente ecuacion diferencial:
b K 1
+ + = T (t) (2.68)
I I I
Notese que este modelo matematico es identico al presentado en (2.53) para
un sistema masa-resorte-amortiguador traslacional si se sustituye la inercia
por la masa, la posicion angular por la posicion xm y el par externo T (t)
por la fuerza externa F (t).
Ejemplo 2.7 En la figura 2.26(a) se muestran dos cuerpos rotativos unidos
por una cremallera. Sobre el cuerpo rotativo de la izquierda se aplica un par
externo T (t). As que se puede pensar que el cuerpo de la izquierda es un
motor el cual debe transmitir movimiento al cuerpo rotativo de la derecha
a traves de una cremallera. Siguiendo las convenciones de signo mostradas
en las figuras 2.3, 2.5, 2.9 y 2.18 se obtienen los diagramas de cuerpo libre
mostrados en las figuras 2.26(b) y 2.26(c). En la figura 2.26(b) se muestra
la parte correspondiente a la conexion de los dos cuerpos rotativos mediante
dos adaptadores tipo pinon-cremallera, mientras que en la figura 2.26(c) se
muestra el diagrama de cuerpo libre de cada uno de los cuerpos rotativos1 . La
nomenclatura utilizada es la siguiente:
vm = dxdtm , donde xm es la posicion de la cremallera de masa m.
1 = ddt , donde 1 es la posicion angular del cuerpo rotativo 1.
1

d2
2 = dt , donde 2 es la posicion angular del cuerpo rotativo 2.
v1 es la velocidad traslacional que se produce en la cremallera como resul-
tado de que el cuerpo 1 gira con velocidad 1 .
v2 es la velocidad traslacional que se produce en la cremallera como resul-
tado de que el cuerpo 2 gira con velocidad 2 .
b1 = ddtb1 , donde b1 es la posicion angular del extremo movil del amorti-
guador unido al cuerpo rotativo 1 (friccion del cuerpo 1 con los rodamien-
tos).
b2 = ddtb2 , donde b2 es la posicion angular del extremo movil del amor-
tiguador unido al 2 (friccion del cuerpo 2 con los rodamientos).
vb = dxdt , donde xb es la posicion del extremo del amortiguador unido a
b

la cremallera m. Este amortiguador representa la friccion de la cremallera


con el suelo.
1
En un sistema pinon-cremallera debe utilizarse el principio de que a toda fuerza
(o par) de accion corresponde una fuerza (o par) de reaccion solo en uno de los
puertos, pues el par (o fuerza) en uno de los puertos es simplemente el reflejo de
la fuerza (o par) en el otro puerto. Vease tambien el ejemplo 2.9
2.6 Ejemplos 53

Motor

T(t) I1 I2

Cremallera m
(a)
T2
!1

r r
T1
F1 F2 F2
F1 w2
m
v1 vm v2
Fb

vb

Fb
(b) Diagrama de cuerpo libre.
b1 T b1 T1 !1

I1
! b1 T b1 T(t)

T2 !2 T b2
b2
I2
T b2 ! b2
(c) Diagrama de cuerpo libre (cont.).

Figura 2.26. Dos cuerpos rotativos unidos por una cremallera.

Usando las figuras 2.26(b) y 2.26(c), as como (2.4), (2.8), (2.18), (2.21),
(2.34), (2.35) se obtienen las siguientes expresiones:

d1
inercia 1: I1 = T (t) + T1 Tb1 (2.69)
dt
d2
inercia 2: I2 = T2 Tb2 (2.70)
dt
54 2 Modelado matematico de sistemas fsicos

dvm
masa: m = F1 F2 + Fb (2.71)
dt
amortiguador izquierdo: b1 b1 = Tb1
amortiguador derecho: b2 b2 = Tb2
amortiguador central: bvb = Fb
pinon-cremallera izquierda: T1 = rF1 , v1 = r1 (2.72)
pinon-cremallera derecha: T2 = rF2 , v2 = r2 (2.73)

Notese que las fuerzas que tienen el mismo sentido que 1 , 2 y vm aparecen
afectadas con un signo positivo en (2.69), (2.70), (2.71) y con un signo nega-
tivo en caso contrario. Considerando que todos los elementos del sistema se
conectan mediante uniones rgidas entonces, de acuerdo a las figuras 2.26(b)
y 2.26(c) se tiene que:

vm = v1 = v2 = vb (2.74)
1 = b1 , 2 = b2 (2.75)

De acuerdo a esto, si se definen xm = 0, 1 = 0, 2 = 0, xb = 0, b1 = 0, b2 =


0 como las posiciones de la cremallera, el cuerpo rotativo 1, el cuerpo rotativo
2 y los extremos moviles de los amortiguadores conectados a la cremallera y
a los cuerpos rotativos 1 y 2, respectivamente, cuando todo el sistema esta en
reposo con T (t) = 0, entonces se concluye que:

xm = xb (2.76)
1 = b1 , 2 = b2

Por tanto, las expresiones en (2.69), (2.70) y (2.71) se pueden escribir como:

d1
inercia 1: I1 = T (t) + rF1 b1 b1 (2.77)
dt
d2
inercia 2: I2 = rF2 b2 b2 (2.78)
dt
dvm
masa: m = F1 F2 + bvb (2.79)
dt
Recordando que v1 = v2 , se pueden usar (2.72) y (2.73) para encontrar
que 1 = 2 . Entonces se puede usar este resultado as como (2.75) para,
restando (2.78) a (2.77), encontrar:

d1
(I1 + I2 ) = T (t) + r(F1 F2 ) (b1 + b2 )1 (2.80)
dt
Por otro lado, usando vm = v1 = r1 = vb se puede escribir (2.79) como

d1
mr = F1 F2 bvm
dt
2.6 Ejemplos 55

Despejando F1 F2 de esta expresion y sustituyendo en (2.80) se obtiene


finalmente:
d1
(I1 + I2 + mr2 ) = T (t) (b1 + b2 + r2 b)1
dt
Esta ecuacion diferencial representa el modelo matematico del sistema en la
figura 2.26(a). En este caso se pudieron combinar tres ecuaciones diferencia-
les distintas en una sola ecuacion diferencial. Esto es debido a que las tres
variables 1 , 2 y vm son linealmente dependientes pues estan relacionadas
mediante las expresiones algebraicas vm = r1 = r2 . Notese tambien
como el radio de los pinones interviene para adaptar i) la masa de la crema-
llera a la inercia equivalente que se produce sobre el eje de la inercia 1 e ii)
la friccion equivalente que sobre el eje de la inercia 1 produce la friccion de la
cremallera con el suelo.

Ejemplo 2.8 En la figura 2.27(a) se muestran dos cuerpos rotativos unidos


por un resorte. Sobre el cuerpo de la izquierda se aplica un par externo T (t).
Entonces, el sistema mostrado en la figura 2.27(a) representa el caso de un
motor (cuerpo de la izquierda) que mueve a una carga (cuerpo de la derecha)
y que el eje que une a ambos cuerpos es flexible. Esta flexibilidad normal-
mente no es introducida intencionalmente, sino que es una caracterstica no
deseada que surge como resultado de la rigidez finita de los materiales con que
se construye el eje que une al motor y la carga. En situaciones como esta es
muy importante tomar en cuenta dicha flexibilidad para estudiar como afec-
ta al desempeno del sistema de control. Siguiendo las convenciones de signo
mostradas en las figuras 2.5, 2.6 y 2.11 se obtiene el diagrama de cuerpo libre
mostrado en la figura 2.27(b). La nomenclatura utilizada es la siguiente:
2 = ddt , donde 2 es la posicion angular del cuerpo 1.
2

d5
5 = dt , donde 5 es la posicion angular del cuerpo 2.
1 = ddt , donde 1 es la posicion angular del extremo movil del amorti-
1

guador conectado al cuerpo 1.


6 = ddt , donde 6 es la posicion angular del extremo movil del amorti-
6

guador conectado al cuerpo 2.


3 = d d4
dt y 4 = dt , donde 3 y 4 son las posiciones angulares de los
3

extremos del resorte.


Usando la figura 2.27(b), as como (2.8), (2.11), (2.21), se obtienen las
siguientes expresiones:

cuerpo 1: I1 2 = T (t) + T1 T3 (2.81)


cuerpo 2: I2 5 = T4 T6 (2.82)
amortiguador izquierdo: b1 1 = T 1
amortiguador derecho: b2 6 = T 6
resorte: KxK = T3 = T4 , xK = 3 4
56 2 Modelado matematico de sistemas fsicos

b1 K b2

I1 I2
T(t)
(a)
!1 T1 !2 T3 T3 !4 T4 T6 T6
I1 I2
T1 T(t) !3 T4 !5 !6
(b) Diagrama de cuerpo libre.

Figura 2.27. Dos cuerpos rotativos unidos por un resorte.

donde la ultima expresion se obtiene de acuerdo al parrafo que sigue a (2.10).


Notese que, en las expresiones (2.81) y (2.82), los pares que tienen el mismo
sentido que 2 y 5 aparecen afectadas con un signo positivo y con un signo
negativo en caso contrario. Considerando que todos los elementos del sistema
se conectan mediante uniones rgidas entonces, de acuerdo a la figura 2.27(b)
se tiene que:

2 = 1 = 3 , 5 = 6 = 4 (2.83)

De acuerdo a esto, si se definen 2 = 0, 5 = 0, 1 = 0, 6 = 0, 3 = 0 y


4 = 0 como las posiciones angulares del cuerpo 1, del cuerpo 2, del extremo
movil del amortiguador izquierdo, del extremo movil del amortiguador derecho
y de los extremos izquierdo y derecho del resorte, respectivamente, cuando todo
el sistema esta en reposo con T (t) = 0, entonces se concluye que:

2 = 1 = 3 , 5 = 6 = 4 (2.84)

Por tanto, las expresiones en (2.81) y (2.82) se pueden escribir como:

cuerpo 1: I1 2 = T (t) + b1 1 K(3 4 )


cuerpo 2: I2 5 = K(3 4 ) b2 6

Usando (2.83) y (2.84) se encuentra finalmente que el modelo matematico


esta dado por las siguientes dos ecuaciones diferenciales que deben ser resuel-
tas simultaneamente:

cuerpo 1: I1 2 + b1 2 + K(2 5 ) = T (t)


cuerpo 2: I2 5 + b2 5 K(2 5 ) = 0

Estas dos ecuaciones diferenciales no pueden ser agrupadas en una sola porque
las variables 2 y 5 son linealmente independientes, es decir, no se cuenta
con una expresion algebraica que relacione a estas dos variables.
2.6 Ejemplos 57

Ejemplo 2.9 En la figura 2.28(a) se muestran dos cuerpos rotativos unidos


a traves de una caja de engranes. Sobre el cuerpo de la izquierda se aplica
un par externo T (t), por lo que este sistema puede ser interpretado como
un motor electrico (cuerpo de la izquierda) que transmite movimiento a una
carga (cuerpo de la derecha) a traves de una caja de engranes. Siguiendo las
convenciones de signo mostradas en las figuras 2.5, 2.11, 2.17 se obtiene el
diagrama de cuerpo libre mostrado en la figura 2.28(b)2 . La nomenclatura
utilizada es la siguiente:
= d
dt , donde es la posicion angular del cuerpo 1.
4 = ddt , donde 4 es la posicion angular del cuerpo 2.
4

db1
b1 = dt , donde b1 es la posicion angular del extremo movil del amor-
tiguador conectado al cuerpo 1.
b2 = ddtb2 , donde b2 es la posicion angular del extremo movil del amor-
tiguador conectado al cuerpo 2.
n1 y n2 son las velocidades angulares en las ruedas dentadas que resultan
del movimiento de los cuerpos 1 y 2.
Tn1 y Tn2 son los pares que aparecen en las ruedas dentadas como resultado
del movimiento de los cuerpos 1 y 2.

b 1 T(t) n1
I1 b2
I2
n2
(a)
T b1 T b1 ! T n1 ! n1
I1 T n2 T3 !4 T b2 T b2
! b1 T(t) I2
! n2 ! b2
(b) Diagrama de cuerpo libre.

Figura 2.28. Dos cuerpos unidos a traves de una caja de engranes.

Usando la figura 2.28(b), as como (2.8), (2.21), (2.32), (2.33) se obtienen


las siguientes expresiones:

cuerpo 1: I1 = T (t) Tb1 Tn1 (2.85)


2
En una caja de engranes debe utilizarse el principio de que a todo par de accion
corresponde un par de reaccion solo en uno de los puertos, pues el par en uno de
los puertos es simplemente el reflejo del par en el otro puerto. Vease tambien el
ejemplo 2.7
58 2 Modelado matematico de sistemas fsicos

cuerpo 2: I2 4 = T3 + Tb2 (2.86)


amortiguador izquierdo: b1 b1 = Tb1
amortiguador derecho: b2 b2 = Tb2
n1 n2
engranes: Tn1 = Tn2 , n1 = n2 , Tn2 = T3 (2.87)
n2 n1
donde la ultima expresion se debe a que, de acuerdo a la tercera ley de Newton,
una accion del cuerpo A sobre el cuerpo B produce una reaccion (en sentido
contrario) del cuerpo B sobre el cuerpo A. Notese que, en las expresiones
(2.85) y (2.86) los pares que tienen el mismo sentido que y 4 aparecen
afectadas con un signo positivo y con un signo negativo en caso contrario.
Considerando que todos los elementos del sistema se conectan mediante unio-
nes rgidas entonces, de acuerdo a la figura 2.28(b) se tiene que:

= b1 = n1 , 4 = b2 = n2 (2.88)

De acuerdo a esto, si se definen = 0, 4 = 0, b1 = 0, b2 = 0, n1 = 0,


n2 = 0 como las posiciones angulares del cuerpo 1, del cuerpo 2, del extremo
movil del amortiguador izquierdo, del extremo movil del amortiguador derecho,
de la rueda dentada 1 y de la rueda dentada 2 cuando todo el sistema esta en
reposo con T (t) = 0, entonces se concluye que:

= b1 = n1 , 4 = b2 = n2 (2.89)

Por tanto, usando (2.88) y (2.89) las expresiones en (2.85) y (2.86) se pueden
escribir como:
n1
cuerpo 1: I1 = T (t) b1 T3 (2.90)
n2
cuerpo 2: I2 4 = T3 b2 4 (2.91)

Por otro lado, de (2.87) y (2.88) se tiene = nn21 4 . Usando esto, despejan-
do T3 de (2.91), sustituyendo en (2.90) y despues de acomodar terminos se
encuentra:
2 ! 2 !
n2 n2 n2
I2 + I1 4 + b2 + b1 4 = T (t) (2.92)
n1 n1 n1

Notese que las dos ecuaciones diferenciales en (2.90) y (2.91) se han podi-
do combinar en una sola ecuacion gracias a que las variables y 4 son
linealmente dependientes pues estan relacionadas a traves de = nn12 4 . Esta
ecuacion diferencial representa el modelo matematico buscado: si se conoce el
par externo aplicado T (t) entonces se puede conocer la posicion 4 del cuerpo
2 al resolver la ecuacion diferencial anterior.
Ejemplo 2.10 En la figura 2.29(a) se muestra el mismo mecanismo de la
figura 2.26(a) (estudiado en el ejemplo 2.7) pero ahora la cremallera es fle-
xible. Esta flexibilidad no se introduce de manera intencional, sino que es un
2.6 Ejemplos 59

problema no deseado que aparece debido a la rigidez finita del material con
el que esta hecha la cremallera. Para encontrar el modelo matematico en este
caso se puede aprovechar el desarrollo realizado en el ejemplo 2.7. Es decir, se
puede partir de las ecuaciones (2.77), (2.78) y (2.79), las cuales se reescriben
a continuacion para facilitar la referencia:
d1
inercia 1: I1 = T (t) + rF1 b1 b1
dt
d2
inercia 2: I2 = rF2 b2 b2
dt
dvm
masa: m = F1 F2 + bvb
dt
considerando ahora que, de acuerdo a la figura 2.29(b) y las convenciones en
la figura 2.4 y (2.7):
F1 = K1 (xA xB ), F2 = K2 (xC xD )
con:
vA = dx dxB
dt y vB = dt , donde xA y xB son las posiciones de los extremos
A

del resorte de la izquierda.


vC = dx dxD
dt y vD = dt , donde xC y xD son las posiciones de los extremos
C

del resorte de la derecha.

xm
I1 K1 K2 I2
m
A B C D

(a)
v AB
F1 F1
vA K1 vB

v CD
F2 F2
vC K2 vD
(b) Flexibilidad en la cremallera.

Figura 2.29. Sistema de transmision tipo cremallera con flexibilidad.

Entonces, usando esto y (2.74) y (2.75) se encuentra:


60 2 Modelado matematico de sistemas fsicos

d1
inercia 1: I1 = T (t) + rK1 (xA xB ) b1 1 (2.93)
dt
d2
inercia 2: I2 = rK2 (xC xD ) b2 2 (2.94)
dt
masa: mxm = K1 (xA xB ) K2 (xC xD ) bxm (2.95)
Por otro lado, de acuerdo a (2.72), (2.73), (2.74), (2.76) y considerando que
todos los elementos del sistema se conectan mediante uniones rgidas se en-
cuentra que:
xB = xC = xm , xA = r1 , xD = r2 (2.96)
donde 1 y 2 son las posiciones angulares de las ruedas dentadas 1 y 2 defi-
nidas de acuerdo a la figura 2.26(b). Sustituyendo (2.96) en (2.93), (2.94) y
(2.95):
inercia 1: I1 1 + b1 1 rK1 (r1 xm ) = T (t)
inercia 2: I2 2 + b2 2 rK2 (xm r2 ) = 0
masa: mxm + bxm K1 (r1 xm ) + K2 (xm r2 ) = 0
El modelo matematico esta dado por estas tres ecuaciones diferenciales que
deben ser resueltas simultaneamente. En este caso no se pueden combinar
estas tres ecuaciones para obtener una sola ecuacion diferencial equivalente
debido a que las variables 1 , 2 y xm son linealmente independientes pues no
se cuenta con una expresion algebraica que relacione a estas tres variables.
Notese que desde el punto de vista del modelado este es el efecto que introdu-
cen los dos resortes considerados en este ejemplo. Comparese con el modelo
matematico obtenido en el ejemplo 2.7.

b1 n1
I1 K b2
I2
T(t)
n2
(a)
T n2 !B
K

!A T n2
(b) Flexibilidad en
los engranes.

Figura 2.30. Sistema de transmision con flexibilidad en la caja de engranes.

Ejemplo 2.11 En la figura 2.30(a) se muestran dos cuerpos giratorios co-


nectados a traves de una caja de engranes y un resorte. El cuerpo del lado
2.6 Ejemplos 61

izquierdo recibe un par externo T (t). Por tanto, este ejemplo representa el
caso de un motor (cuerpo izquierdo) que transmite movimiento a una carga
(cuerpo derecho) a traves de una caja de engranes cuyos dientes son flexibles.
Esta flexibilidad es un problema no deseado que, sin embargo, aparece en la
practica debido a la rigidez finita del material con el que se hacen los engranes
(acero). Para resolver este problema se puede aprovechar el desarrollo presen-
tado en el ejemplo 2.9 para modelar el sistema mostrado en la figura 2.28(a).
Por tanto, se puede regresar a las expresiones en (2.90) y (2.91), las cuales
se reescriben a continuacion para facilitar la referencia:
n1
cuerpo 1: I1 = T (t) b1 Tn2 (2.97)
n2
cuerpo 2: I2 4 = Tn2 b2 4 (2.98)

pero ahora, de acuerdo a las figuras 2.30(b) y 2.6 y a (2.11):

Tn2 = K(A B )

donde A = A y B = B con A y B las posiciones angulares de los


extremos del resorte. Por otro lado, de acuerdo a (2.87) se tiene que = nn21 A ,
porque A = n2 y n1 = , donde y A son las posiciones angulares
del cuerpo 1 y del extremo del resorte conectado a la rueda dentada 2, segun
se define en la figura 2.30(b). Notese ademas que B = 4 . Sustituyendo todo
esto en (2.97) y (2.98) se encuentra:

n1 n1
cuerpo 1: I1 + b1 + K 4 = T (t)
n2 n2

n1
cuerpo 2: I2 4 + b2 4 K 4 = 0
n2

Estas dos ecuaciones diferenciales deben ser resueltas simultaneamente y re-


presentan el modelo matematico buscado. Notese que estas dos ecuaciones
diferenciales no pueden ser combinadas en una sola debido a que las variables
y 4 son linealmente independientes, es decir no se cuenta con una expresion
algebraica que relacione a estas variables. Esta es la principal diferencia con
el problema resuelto en el ejemplo 2.9 y es debida a la introduccion del resorte
en el presente ejemplo.

Ejemplo 2.12 (tomado de [6], pp. 122). En la figura 2.31 se muestra un


servomecanismo, es decir, se trata de un motor de CD con escobillas que se
usa para mover un cuerpo de masa M atraves de una caja de engranes y
de un adaptador del tipo pinon-cremallera. El cuerpo M se mueve sobre un
plano horizontal, por lo que no es necesario tomar en consideracion el efecto
de la gravedad. Siguiendo las convenciones de signo mostradas en las figuras
2.5, 2.3, 2.11, 2.9, 2.17, 2.18, 2.19 se obtienen los diagramas de cuerpo libre
mostrados en la figura 2.32. En la figura 2.32(a) se desglosan los componentes
62 2 Modelado matematico de sistemas fsicos

electricos del motor de CD, en la figura 2.32(b) se desglosan los componentes


mecanicos del motor y la caja de engranes mientras que en la figura 2.32(c) se
muestran los elementos que componen al sistema pinon-cremallera3 . Notese
que se considera friccion entre el motor y sus rodamientos as como la friccion
entre el pinon y sus rodamientos y friccion entre el cuerpo M y su soporte (o
el suelo). La nomenclatura utilizada es la siguiente:
m = ddtm , donde m es la posicion angular del motor.
P = ddtP , donde P es la posicion angular del pinon.
x = dx
dt , donde x es la posicion del cuerpo M .
b1 = ddtb1 , donde b1 es la posicion angular del extremo movil del amor-
tiguador conectado al motor.
b2 = ddtb2 , donde b2 es la posicion angular del extremo movil del amor-
tiguador conectado al pinon.
vb3 = dxdtb3 , donde xb3 es la posicion del extremo movil del amortiguador
conectado al cuerpo M .
1 y 2 son las velocidades angulares en las ruedas dentadas resultantes
del movimiento del motor y del pinon.
u es el voltaje aplicado a la armadura del motor e i es la corriente que
circula a traves de la armadura del motor.
3
Veanse los pies de pagina correspondientes a los ejemplos 2.9 y 2.7

n1
+ Pion
u Motor
b1
r

n2

Cremallera

b2

Figura 2.31. Servomecanismo.


2.6 Ejemplos 63

R L
+ T n1
+ b1
u i eb
Im r

IP

n2 b2

M
b3

(a)
b1 T b1 T T1 !1 n 1

Im T2 !2
T b1 ! b1 m

n2
(b)
!P !P
T b2 T b2
r
IP
! b2 TP
T2 v
F

M x

F b3

v b3
F b3

(c)

Figura 2.32. Diagrama de cuerpo libre correspondiente a la figura 2.31.


64 2 Modelado matematico de sistemas fsicos

F , TP y v son la fuerza, el par y la velocidad traslacional que se producen


en el sistema pinon-cremallera como resultado del movimiento del pinon
y la masa M .
Usando la figura 2.32, as como (2.4), (2.8), (2.18), (2.21), (2.32), (2.33),
(2.34), (2.35) se obtienen las siguientes expresiones:

inercia motor: Im m = T T1 Tb1 (2.99)


inercia pinon: IP P = T2 + Tb2 + TP (2.100)
masa M : M x = F Fb3 (2.101)
amortiguador motor: b1 b1 = Tb1
amortiguador pinon: b2 b2 = Tb2
amortiguador masa M : b3 vb3 = Fb3
n1 n2
engranes: T1 = T 2 , 1 = 2 (2.102)
n2 n1
pinon-cremallera: v = rP , TP = rF (2.103)

Notese que, en las expresiones (2.99), (2.100) y (2.101), las fuerzas que tienen
el mismo sentido que m , P y x aparecen afectadas con un signo positivo y
con un signo negativo en caso contrario. Considerando que todos los elementos
del sistema se conectan mediante uniones rgidas entonces, de acuerdo a la
figura 2.32 se tiene que:

v = x = vb3 (2.104)
m = b1 = 1 , 2 = b2 = P (2.105)

De acuerdo a esto, si se definen x = 0, xb3 = 0, m = 0, b1 = 0, b2 = 0 como


las posiciones del cuerpo M , el extremo movil del amortiguador conectado al
cuerpo M , el rotor del motor, el extremo movil del amortiguador conectado
al rotor del motor y el extremo movil del amortiguador conectado al pinon,
respectivamente, cuando todo el sistema esta en reposo con T = 0, entonces
se concluye que:

x = xb3 (2.106)
m = b1 (2.107)

Por tanto, las expresiones en (2.99), (2.100) y (2.101) se pueden escribir


como:
n1
inercia motor: Im m = T T2 b1 b1
n2
inercia pinon: IP P = T2 + b2 b2 + rF
masa M : M x = F b3 vb3

Usando (2.104) y (2.105):


2.6 Ejemplos 65
n1
inercia motor: Im m = T T2 b1 m (2.108)
n2
inercia pinon: IP P = T2 b2 P + rF (2.109)
masa M : M x = F b3 x (2.110)

Por otro lado, de acuerdo a (2.102), (2.103), (2.104) y (2.105) se encuentra


que m = nn12r x. Usando esto, despejando T2 de (2.109) y sustituyendo en
(2.108):
n2 n2 n1
Im x + b1 x = T [IP P + b2 P rF ] (2.111)
n1 r n1 r n2
De (2.103) y (2.104) se tiene que x = rP . Usando esto en (2.111) y susti-
tuyendo F de (2.110) se encuentra:

n2 n2 n1 n1 n1 n1
Im x + b1 x = T IP + rM x b2 + rb3 x
n1 r n1 r n2 r n2 n2 r n2
Agrupando terminos se obtiene finalmente:
2 ! 2 !
n2 1 n2 1 n2
Im + IP 2 + M x + b1 + b2 2 + b3 x = T
n1 r r n1 r r n1 r
(2.112)

Por otro lado, usando la Ley de voltajes de Kirchhoff (vease el ejemplo 2.14)
al circuito de la figura 2.32(a) se obtiene:
di
L + Ri + eb = u (2.113)
dt
Usando (2.38), (2.39) y m = nn12r x se encuentra que el voltaje inducido y el
par generado estan dados como:
n2
eb = ke m = ke x, T = km i
n1 r
Entonces, usando este resultado, (2.113) y (2.112) se encuentra, finalmente,
que el modelo matematico buscado esta representado por las dos ecuaciones
diferenciales siguientes, las cuales deben ser resueltas simultaneamente:
di n2
+ Ri + ke L x = u (2.114)
dt n1 r
2 ! 2 !
n2 1 n2 1 n2
Im + IP 2 + M x + b1 + b2 2 + b3 x = km i
n1 r r n1 r r n1 r
(2.115)

Otra manera de expresar este modelo matematico es mediante una sola ecua-
cion diferencial obtenida al combinar (2.114) y (2.115). Para esto, dervese
66 2 Modelado matematico de sistemas fsicos

di
una vez respecto al tiempo a (2.115). Esto produce la aparicion de dt en el
miembro derecho de la ecuacion resultante. A continuacion se sustituye el va-
di
lor de dt obtenido al despejar de (2.114). Con esto se obtiene una ecuacion
3
diferencial en terminos de de ddt3x , x, x e i. Para eliminar i, se despeja esta
variable de (2.115) y se sustituye. As, se obtiene una ecuacion diferencial de
tercer orden en la variable x con el voltaje u como excitacion. De este modo
el modelo matematico queda representado por una sola ecuacion diferencial a
partir de la cual se puede conocer la posicion x de la masa M si se conoce el
voltaje u aplicado al motor. Se deja como ejercicio para el lector el realizar el
procedimiento descrito.

Ejemplo 2.13 En la figura 2.33(a) se muestra un pendulo simple donde


representa la posicion angular del pendulo respecto de la vertical y = d
dt .
Se supone que toda la masa m del pendulo esta concentrada en el extremo y
que la varilla, de longitud l, no tiene masa (o esta es despreciable comparada
con la masa m). El diagrama de cuerpo libre correspondiente se muestra en la
figura 2.33(b). El pendulo puede ser considerado un cuerpo rotativo de inercia:

I = ml2

la cual corresponde a la inercia de una partcula de masa m que describe un


movimiento circular con un radio constante l [7], cap. 9. Se considera que
sobre el pendulo actuan tres pares: 1) el par externo T (t), 2) el par debido
a la friccion, Tb , existente en el punto de donde se sostiene el pendulo y 3)
el par debido a la fuerza de gravedad, Tg . De acuerdo a las figuras 2.33(a) y
2.33(b), el par Tg esta aplicado en sentido contrario a como se define y su
magnitud es igual a:

Tg = peso del pendulo brazo de palanca


= mg d, d = l sin()
= mgl sin() (2.116)

Usando la figura 2.33(b), as como (2.8), (2.21), se obtienen las siguientes


expresiones:

cuerpo giratorio: I = T (t) + Tb Tg (2.117)


amortiguador: bb = Tb

Notese que los pares que se aplican sobre el cuerpo I y tienen el mismo sentido
que la velocidad angular , aparecen afectados por un signo positivo en (2.117).
En caso contrario aparecen afectados por un signo negativo, como es el caso
de Tg . Considerando que todos los elementos del sistema se conectan mediante
uniones rgidas entonces, de acuerdo a la figura 2.33(b) se tiene que:

= b (2.118)
2.6 Ejemplos 67

T(t)

l
Tg
g Tb Tb
m
I
b
d !b T(t)
(a) (b) Diagrama de cuerpo libre.

Figura 2.33. Pendulo simple.

Por tanto, si se definen = 0, b = 0 (con b = b ) como las posiciones


angulares del pendulo y el extremo movil del amortiguador, respectivamente,
cuando todo el sistema esta en reposo con T (t) = 0, entonces se concluye que:

= b (2.119)

Entonces, las expresiones en (2.117) y (2.116) se pueden escribir como:

I = T (t) + bb mgl sin()


= T (t) b mgl sin()

Finalmente, se obtiene que el modelo matematico correspondiente esta dado


por la siguiente ecuacion diferencial:

ml2 + b + mgl sin() = T (t)

Notese que esta es una ecuacion diferencial de segundo orden pero no lineal,
caracterstica que es debida al hecho de que aparece la funcion sin(). En
la seccion 7.2 del captulo 7 se explica la manera de manipular este tipo de
ecuaciones diferenciales. Mas aun, en los captulos 11, 13 y 14 se muestra
como disenar controladores para este tipo de ecuaciones diferenciales.

Ejemplo 2.14 En la figura 2.34(a) se muestra un circuito RLC conectado


en serie y alimentado con una fuente de voltaje. La manera de relacionar a
los elementos del circuito en este tipo de conexion electrica es usando la Ley
de Kirchhoff de voltajes [8], pag. 67:

Propiedad 2.1 Ley de Kirchhoff de voltajes. La suma de los voltajes


alrededor de un trayecto cerrado es igual a cero.

Usando las convenciones de signo de las figuras 2.7, 2.8, 2.12 se obtiene
el diagrama mostrado en la figura 2.34(b). Entonces, a partir de esta figura y
68 2 Modelado matematico de sistemas fsicos

C L

+
vi R

(a)

+ vC + vL
C L
+ +
vi i R vR

(b)

Figura 2.34. Circuito RLC conectado en serie.

usando (2.12), (2.13), (2.15), (2.16), (2.22) as como la Ley de Kirchhoff de


voltajes se obtiene:
vi = v L + v R + v C
Z t
q
vC = , q = i(r)dr, si q(0) = 0 (2.120)
C 0
d
vL = , = Li (2.121)
dt
dq
vR = iR, i = (2.122)
dt
Notese que la corriente electrica que circula por todos los componentes del
circuito es la misma. Por tanto:
d2 q dq 1
vi = L 2
+R + q (2.123)
dt dt C
o bien:
Z t
di 1
vi = L + Ri + i(r)dr (2.124)
dt C 0

El modelo matematico correspondiente esta representado por cualquiera de las


expresiones en (2.123) o (2.124).
A partir de (2.122) se observa que existe una relacion algebraica (y lineal,
ademas) entre el voltaje en una resistencia y la corriente a traves de la mis-
ma: vR = iR. Notese que la resistencia R es el factor constante que relaciona
2.6 Ejemplos 69

corriente y voltaje en una resistencia viR = R. Este hecho motiva el cuestio-


narse si acaso existe una relacion similar entre la corriente y el voltaje en
un inductor y en un capacitor. Sin embargo, a partir de (2.120) y (2.121) se
observa que, a menos que se introduzca algun artificio matematico, esto no
es posible por que estan de por medio una derivada y una integral. Entonces,
el artificio matematico que se usa es la transformada de Laplace ya que esta
tiene las siguientes propiedades:
Z t
dx 1
L = sX(s), L x(r)dr = X(s), si x(0)=0 (2.125)
dt 0 s

donde X(s) es la transformada de Laplace de x(t), es decir L{x(t)} = X(s).


Por tanto, a partir de (2.120) y (2.121) se obtiene, mediante el uso de la
transformada de Laplace y considerando todas las condiciones iniciales iguales
a cero:
1
VC (s) = I(s)
sC
VL (s) = sLI(s)

donde L{vC (t)} = VC (s), L{vL (t)} = VL (s) y L{i(t)} = I(s). Por tanto, aho-
ra se tiene una relacion algebraica entre las transformadas de Laplace de los
voltajes y las corrientes en un inductor y un capacitor. Al factor que relaciona
a estas variables se le denomina impedancia y se representa como:

V (s)
Z(s) = (2.126)
I(s)

Es decir, la impedancia de un inductor es:

VL (s)
ZL (s) = = sL (2.127)
I(s)

mientras que la impedancia en un capacitor es:

VC (s) 1
ZC (s) = = (2.128)
I(s) sC

Entonces, usando la transformada de Laplace y el concepto de impedancia se


puede escribir el modelo matematico en (2.124) como:
1
Vi (s) = sLI(s) + RI(s) + I(s)
sC
Vi (s) = ZL (s)I(s) + RI(s) + ZC (s)I(s)
Vi (s) = (ZL (s) + R + ZC (s))I(s)

lo cual motiva el definir la impedancia total del circuito serie como:


70 2 Modelado matematico de sistemas fsicos

Zt (s) = ZL (s) + R + ZC (s)


1 Vi (s)
Zt (s) = sL + R + , Zt (s) = (2.129)
sC I(s)

Con lo anterior se prueba una propiedad importante en circuitos electricos


conectados en serie:

Propiedad 2.2 La impedancia total de un circuito serie es igual a la suma


de las impedancias de todos los elementos conectados en serie.

El concepto de impedancia es muy importante en circuitos electricos y es


una de las herramientas que normalmente se utilizan para modelar y analizar
circuitos en ingeniera. Es decir, las expresiones en (2.129) tambien represen-
tan el modelo matematico del circuito en la figura 2.34(a).

Ejemplo 2.15 En la figura 2.35(a) se muestra un circuito RLC conectado en


paralelo y alimentado con una fuente de corriente. La manera de relacionar
los componentes del circuito en este tipo de conexion electrica es usando la
Ley de Kirchhoff de corrientes [8], pag. 68:

Propiedad 2.3 Ley de Kirchhoff de corrientes.. La suma de las corrien-


tes que entran a un nodo es igual a la suma de las corrientes que salen del
mismo nodo.

ii L C R

(a)

+
ii L C R v
iL iC iR


(b)

Figura 2.35. Circuito RLC conectado en paralelo.

Usando las convenciones de signo de las figuras 2.7, 2.8, 2.12 se obtiene
el diagrama mostrado en la figura 2.35(b). Entonces, a partir de esta figura y
2.6 Ejemplos 71

usando (2.12), (2.13), (2.15), (2.16), (2.22) as como la Ley de Kirchhoff de


corrientes se obtiene:
ii = iL + iR + iC
Z t
dv
q = vC, q = iC (r)dr, si q(0) = 0 iC = C (2.130)
0 dt
Z
1 t diL
iL = v(r)dr, v = L (2.131)
L 0 dt
v
iR = (2.132)
R
Notese que el voltaje es el mismo en todos los componentes del circuito. Por
tanto, el modelo matematico esta representado por:
Z
1 t v dv
ii = v(r)dr + + C (2.133)
L 0 R dt
A partir de (2.130) y (2.131) se obtiene, mediante el uso de la transformada de
Laplace (vease (2.125)) y considerando todas las condiciones iniciales iguales
a cero:
IC (s) = sCV (s)
1
IL (s) = V (s)
sL
donde L{iC (t)} = IC (s), L{iL (t)} = IL (s) y L{v(t)} = V (s). Al factor que
relaciona a las transformadas de Laplace de la corriente y el voltaje en un
elemento de circuito se le denomina admitancia y se representa como:
I(s)
Y (s) = (2.134)
V (s)
Es decir, la admitancia de un inductor es:
IL (s) 1
YL (s) = = (2.135)
V (s) sL
mientras que la admitancia en un capacitor es:
IC (s)
YC (s) = = sC (2.136)
V (s)
Entonces, usando la transformada de Laplace y el concepto de admitancia se
puede escribir el modelo matematico en (2.133) como:
1 1
Ii (s) = V (s) + V (s) + sCV (s)
sL R
1
Ii (s) = YL (s)V (s) + V (s) + YC (s)V (s)
R
1
Ii (s) = (YL (s) + + YC (s))V (s)
R
72 2 Modelado matematico de sistemas fsicos

lo cual motiva el definir la admitancia total del circuito en paralelo como:


1
YT (s) = YL (s) + + YC (s)
R
1 1 Ii (s)
YT (s) = + + sC, YT (s) = (2.137)
sL R V (s)

Con lo anterior se prueba una propiedad importante en circuitos electricos


conectados en paralelo:

Propiedad 2.4 La admitancia total de un circuito en paralelo es igual a la


suma de las admitancias de todos los elementos conectados en paralelo.

El concepto de admitancia es muy importante en circuitos electricos y es la


otra herramienta que normalmente se utiliza para modelar y analizar circuitos
en ingeniera. Es decir, las expresiones en (2.137) tambien representan el
modelo matematico del circuito en la figura 2.35(a).
A partir de las definiciones de impedancia y admitancia en (2.126) y
(2.134) es claro que la admitancia es la inversa de la impedancia, es decir:
1
Y (s) = (2.138)
Z(s)

Esto tambien se comprueba al comparar las definiciones de impedancia y ad-


mitancia en un inductor y un capacitor mostradas en (2.127), (2.128), (2.135)
y (2.136). Entonces, a partir de (2.137) se puede escribir:
1 1 1 1 1
= + + , YT (s) =
ZT (s) ZL (s) R ZC (s) ZT (s)

donde ZT (s) representa la impedancia total del circuito conectado en paralelo


mostrado en la figura 2.35(a). No debe relacionarse ZT (s) con Zt (s) definida
en (2.129) como la impedancia total del circuito conectado en serie mostra-
do en la figura 2.34(a). Generalizando la expresion anterior al caso en que
se tienen n elementos de circuito conectados en paralelo, se encuentra la si-
guiente expresion general para el calculo de la impedancia total de n elementos
conectados en paralelo:
1 1 1 1
= + + ... + (2.139)
ZT (s) Z1 (s) Z2 (s) Zn (s)

En el caso en que solo dos elementos de circuito estan conectado en paralelo


es facil comprobar que la expresion anterior se reduce a:

Z1 (s)Z2 (s)
ZT (s) = (2.140)
Z1 (s) + Z2 (s)
2.6 Ejemplos 73

I(s) R C
+ +

V i (s) C R V o (s)

Figura 2.36. Circuito RC serie-paralelo.

Ejemplo 2.16 Considere el circuito mostrado en la figura 2.36. Si Vo (s) es el


voltaje en las terminales de los elementos de circuito conectados en paralelo y
si Zp (s) es la impedancia total de estos dos elementos conectados en paralelo,
se puede escribir:
Vo (s)
Zp (s) = (2.141)
I(s)
1
R sC R
Zp (s) = 1 = RCs + 1
R + sC
donde se ha usado (2.140) para calcular la impedancia de dos elementos co-
nectados en paralelo. Notese que I(s) es la corriente total a traves de los dos
elementos conectados en paralelo. Por otro lado, si Zsp (s) es la impedancia to-
tal del circuito serie-paralelo, es decir, la impedancia medida en las terminales
donde se aplica el voltaje Vi (s), entonces se puede escribir:
Vi (s)
Zsp (s) = (2.142)
I(s)
1 R
Zsp (s) = R + +
sC RCs + 1
donde se ha usado el hecho de que la impedancia total de elementos conectados
en serie es igual a la suma de las impedancias de cada elemento y que la
impedancia de los dos elementos en paralelo esta dada en (2.141). Combinando
las expresiones en (2.141) y (2.142) obtiene:
R
Vo (s) Zp (s) RCs+1
= GT (s) = = 1 R
Vi (s) Zsp (s) R+ sC + RCs+1

por lo que se puede escribir:


Vo (s) Ts
= GT (s) = 2 2 , T = RC (2.143)
Vi (s) T s + 3T s + 1
Notese que GT (s) no es una impedancia ya que esta dada como el cociente de
dos impedancias y el cociente de dos voltajes.
74 2 Modelado matematico de sistemas fsicos

Ejemplo 2.17 Considere el circuito mostrado en la figura 2.37. A continua-


cion se muestra como obtener la relacion F (s) = VV21 (s)
(s) . Primero se definen los
tres trayectos cerrados (o mallas) mostrados en la figura 2.37, por los cuales
circulan las corrientes de malla I1 (s), I2 (s) e I3 (s). A continuacion se utiliza
la siguiente regla para aplicar la Ley de Kirchhoff de voltajes:
Considere la malla i. La suma algebraica de los voltajes en todos los ele-
mentos de circuito en la malla i se iguala a cero. El voltaje en un elemento de
circuito es el producto de su impedancia por la suma algebraica de las corrien-
tes de malla en ese elemento de circuito. La corriente de malla i siempre se
ve afectada con un signo + y las corrientes que van en sentido opuesto se
afectan con un signo . El voltaje en una fuente de voltaje se afecta con un
signo + si la corriente de la malla i pasa atraves de la fuente de un signo
+ a un signo y se afecta con un signo en caso contrario.
Esta regla constituye la base del metodo de analisis de mallas utilizado para
el analisis de circuitos en ingeniera. Se recomienda consultar las referencias
[9] y [8] para una exposicion mas amplia del metodo. Usando esta regla en
cada una de las mallas mostradas en la figura 2.37 se obtiene:

C C C

+ +
V 1(s) I1 R I2 R I3 R V 2(s)

Figura 2.37. Red RC de defasaje.

1
I1 (s) + (I1 (s) I2 (s))R = V1 (s) (2.144)
sC
1
(I2 (s) I1 (s))R + I2 (s) + (I2 (s) I3 (s))R = 0
sC
1
(I3 (s) I2 (s))R + I3 (s) + V2 (s) = 0, V2 (s) = RI3 (s)
sC
De la tercera ecuacion en (2.144) se obtiene:

1 1
I2 (s)R = R+ V2 (s) + V2 (s) (2.145)
R sC

Sustituyendo esto e I3 (s) = V2R(s) en la segunda ecuacion mostrada en (2.144)


se obtiene una expresion que permite calcular I1 (s) en funcion de V2 (s) sola-
mente. Sustituyendo este valor de I1 (s) e I2 (s) dado en (2.145) en la primera
2.6 Ejemplos 75

ecuacion mostrada en (2.144) se obtiene V1 (s) como funcion de V2 (s) so-


lamente. Finalmente, acomodando terminos convenientemente se obtiene la
expresion buscada:

V2 (s) R3 C 3 s3
= 3 3 3 = F (s) (2.146)
V1 (s) R C s + 6R2 C 2 s2 + 5RCs + 1

Ejemplo 2.18 Un convertidor electronico de potencia de CD/CD es un cir-


cuito que en su entrada recibe un voltaje de CD y en su salida entrega otro
voltaje de CD pero de valor diferente al recibido en su entrada. En la figura
2.38(a) se muestra el circuito de un convertidor electronico de potencia de
CD/CD tipo Boost o elevador de voltaje. Esto significa que el voltaje de CD
en la salida del convertidor es mayor que el voltaje de CD en su entrada. Se
puede observar que la construccion del sistema se realiza mediante dispositivos
semiconductores (transistor-diodo). El transistor Q tiene dos posibles estados:
el estado apagado (corte) u = 0, y el estado encendido (saturacion) u = 1. En
el estado apagado el diodo D se polariza directamente, y permite el paso de
la energa entre la fuente de voltaje E y la carga del sistema R. En el estado
encendido el diodo D se polariza inversamente, y en consecuencia no existe
conexion entre la fuente de voltaje E y la carga del sistema R.
El modelo matematico asociado al convertidor de potencia de CD/CD
Boost esta definido por:
di
L = E (1 u) (2.147)
dt
d
C = (1 u)i (2.148)
dt R
donde i es la corriente electrica a traves del inductor L, v es el voltaje en las
terminales del capacitor C y la constante E representa el voltaje de CD que
se aplica en la entrada del sistema. Este sistema tiene por salida v, el cual
tiene la caracterstica de satisfacer la siguiente desigualdad E. La entrada
de control u representa la funcion de posicion del interruptor, la cual es una
senal que solo toma el valor de 0 o de 1.
Para la obtencion del modelo matematico del convertidor de potencia de
CD/CD Boost (2.147)-(2.148) y el analisis del mismo, se introduce el con-
cepto de interruptor ideal, mostrado en la figura 2.38(b). En este circuito el
interruptor ideal tiene dos posibles posiciones: el caso en el cual u = 0 que
corresponde al circuito equivalente mostrado en la figura 2.39(a), asociado al
hecho de que el transistor Q este apagado. Mientras que para el caso u = 1, el
circuito equivalente que se obtiene es el mostrado en la figura 2.39(b), estando
el transistor Q encendido.
Partiendo de los circuitos equivalentes mostrados en las figuras 2.39(a) y
2.39(b), el empleo de la Ley de Kirchhoff de Voltajes (LVK) y la Ley de Kir-
chhoff de Corrientes (LCK), se procede a la obtencion del modelo matematico
asociado al convertidor de potencia de CD/CD Boost:
76 2 Modelado matematico de sistemas fsicos

L D
i

E Q v R

(a) Construccion del convertidor mediante


transistor-diodo.
L
i u

E v C R
u
(b) Convertidor con interruptor ideal.

Figura 2.38. Convertidor de potencia conmutado de CD/CD Boost.

L
i a

E I v C R

(a) Interruptor colocado en u = 0.


L
i a

E I v C R

(b) Interruptor colocado en u = 1.

Figura 2.39. Circuitos equivalentes del convertidor de CD/CD Boost.

Para el caso en el cual u = 0, el circuito equivalente es el mostrado en


la figura 2.39(a). Aplicando la LVK a la malla I y la LCK al nodo a de
mencionada figura, se obtienen respectivamente las relaciones dinamicas
que gobiernan a la corriente i y al voltaje v:
di
L = E (2.149)
dt
d
C = i (2.150)
dt R
Para el caso en el cual u = 1, se obtiene el circuito equivalente mostrado
en la figura 2.39(b). De igual manera, aplicando la LVK a la malla I y
2.6 Ejemplos 77

la LCK al nodo a de la figura en cuestion, las ecuaciones que se obtienen


para la corriente i y el voltaje v, respectivamente son:
di
L =E (2.151)
dt
d
C = (2.152)
dt R
Mediante simple inspeccion se pueden relacionar las ecuaciones obtenidas en
los circuitos equivalentes, mostrados en las figuras 2.39(a) y 2.39(b), a traves
de la variable u, de la siguiente manera:
di
L = E (1 u) (2.153)
dt
d
C = (1 u)i (2.154)
dt R
ya que cuando u = 0 o u = 1, se generan los sistemas (2.149)-(2.150) y
(2.151)-(2.152), respectivamente. De esta forma, el modelo matematico del
convertidor de potencia de CD/CD Boost esta determinado por el sistema
de ecuaciones diferenciales no lineales (2.153)-(2.154). A este conjunto de
ecuaciones se le denomina modelo conmutado, que hace referencia al hecho
de que la posicion del interruptor u solo puede tomar el valor de 0 o de 1.
Con la intencion de conocer el valor en estado estacionario de las variables
asociadas al sistema (2.153)-(2.154), se parte del modelo promedio del con-
vertidor. En este modelo se supone que la conmutacion (encendido-apagado)
del transistor ocurre a muy alta frecuencia de modo que se puede expresar el
modelo en terminos de variables promedio, es decir:

di
L = E (1 uav ) (2.155)
dt
d
C = (1 uav )i (2.156)
dt R
donde i y representan, respectivamente, la corriente y el voltaje promedio en
el inductor y el capacitor. Mientras que la entrada uav ahora denota la entrada
de control promedio, la cual puede tomar valores en el intervalo continuo [0,1),
siendo esta la funcion de posicion promedio del interruptor.
Como consecuencia de imponer que la entrada del convertidor sea uav =
di
U = constante, se encuentra que en estado estacionario (cuando dt = 0 y
d
dt = 0) el sistema (2.155)-(2.156) genera que:

0 (1 U ) i E
= (2.157)
(1 U ) R1 0

As, resolviendo (2.157) se encuentra que en estado estacionario i y satis-


facen las siguientes relaciones:
78 2 Modelado matematico de sistemas fsicos

1 E
i= (2.158)
R (1 U )2
E
= (2.159)
(1 U )
De esta manera, a partir de las relaciones en estado estacionario, determi-
nadas por (2.158)-(2.159), es claro que se tiene la siguiente relacion estatica
(en estado estacionario) promedio:
1
H(U ) = = (2.160)
E (1 U )

De (2.160) se puede observar que el cociente E es mayor o igual a uno,
pues U [0, 1), de ah que a este convertidor se le conozca como elevador de
voltaje. Finalmente, en la figura 2.40 se puede observar la curva caracterstica
estatica del convertidor Boost, donde claramente se ve cumplida la desigualdad
E.

10

6
H(U)

0
0 0.2 0.4 0.6 0.8 1
U

Figura 2.40. Ganancia de voltaje estatico del convertidor de potencia Boost.

Ejemplo 2.19 El circuito de un convertidor de potencia de CD/CD tipo


Boost-Boost ideal, es decir sintetizado con interruptores, se muestra en la
figura 2.41. Mientras que el circuito practico es el que se muestra en la figura
2.42.
En el sistema mostrado en la figura 2.41 las entradas u1 y u2 solo pueden
tomar el valor de 0 o de 1, que corresponden fsicamente a la posicion de los
interruptores (vease la figura 2.41). Estas posiciones en la practica se efectuan
por medio de transistores en modo de operacion de corte/saturacion, como se
ilustra en figura 2.42. Cabe mencionar que el estado de corte de los transistores
equivale al caso en el que u1 = 0, u2 = 0, y el estado de saturacion de los
transistores equivale a tener u1 = 1, u2 = 1 en la figura 2.41.
2.6 Ejemplos 79

Figura 2.41. Circuito del convertidor de potencia de CD/CD Boost-Boost ideal.

Figura 2.42. Circuito del convertidor de potencia de CD/CD Boost-Boost real.

El resto de las variables involucradas en el sistema de la figura 2.41 son: i1 ,


1 , i2 y 2 , las cuales corresponden a las corrientes y voltajes, respectivamente,
asociados a L1 , C1 , L2 y C2 . Asimismo, la constante E representa el voltaje
de CD aplicado a la entrada del convertidor y 2 la salida, misma que entrega
un voltaje amplificado que satisface la siguiente relacion: 2 E, lo cual
quedara demostrado cuando se realice un analisis en estado permanente del
sistema Boost-Boost, a partir de la obtencion de su modelo matematico.
Partiendo de la figura 2.41 o 2.42 se procede a obtener el modelo matemati-
co que describe la evolucion del sistema a lo largo del tiempo con la ayuda de
la Ley de Kirchhoff de Voltajes (LVK) y la Ley de Kirchhoff de Corrien-
tes (LCK). Para esto, se consideran los cuatro casos diferentes que pueden
suscitarse de los dos posibles estados que toma cada transistor (encendido o
apagado), generando cuatro circuitos equivalentes, cada uno representado por
subsistemas de ecuaciones diferenciales lineales de cuarto orden. Finalmente,
estos subsistemas se hacen comulgar en un solo sistema diferencial de cuar-
to orden no lineal que constituye el modelo matematico final del convertidor
Boost-Boost. A continuacion se muestra tal proceso.
a) Para el caso en el cual los transistores Q1 y Q2 estan encendidos, i. e.,
u1 = 1 y u2 = 1 (vease la figura 2.41), el circuito equivalente es el que
muestra en la figura 2.43(a). Aplicando la LVK a las mallas I y II de la
figura 2.43(a) se obtienen las ecuaciones que gobiernan a las corrientes i1 e
i2 , respectivamente determinadas por:
di1
L1 = E, (2.161)
dt
di2
L2 = 1 . (2.162)
dt
Por otro lado, aplicando la LCK a los nodos A y B de la figura 2.43(a), se
obtienen las ecuaciones diferenciales asociadas a los voltajes 1 y 2 , dadas
80 2 Modelado matematico de sistemas fsicos

por:
d1 1
C1 = i2 , (2.163)
dt R1
d2 2
C2 = . (2.164)
dt RL
b) Para el caso en el que Q1 esta encendido y Q2 apagado, i. e., u1 = 1 y
u2 = 0, a partir de la figura 2.41, el circuito equivalente es el que muestra en
la figura 2.43(b). Aplicando la LVK a las mallas I y II de la figura 2.43(b)
se obtienen las ecuaciones para i1 e i2 respectivamente:
di1
L1 = E, (2.165)
dt
di2
L2 = 1 2 . (2.166)
dt
De igual forma, aplicando la LCK en los nodos A y B de la figura 2.43(b), se
obtienen las ecuaciones que gobiernan a los voltajes 1 y 2 :
d1 1
C1 = i2 , (2.167)
dt R1
d2 2
C2 = i2 (t) . (2.168)
dt RL
c) Cuando Q1 esta apagado y Q2 encendido, i. e., u1 = 0 y u2 = 1, el circuito
resultante es el que muestra en la figura 2.43(c) y aplicando la LVK en las
mallas I y II, se logra el planteamiento de las ecuaciones que describen el
comportamiento de las corrientes i1 e i2 respectivamente:
di1
L1 = 1 + E, (2.169)
dt
di2
L2 = 1 . (2.170)
dt
Asimismo, valiendose de la LCK para los nodos A y B de la figura 2.43(c),
se tiene lo siguiente:
d1 1
C1 = i1 i2 , (2.171)
dt R1
d2 2
C2 = . (2.172)
dt RL
d) Finalmente, cuando u1 = 0 y u2 = 0, el cual corresponde al caso en el que
los transistores se encuentran apagados, el circuito equivalente es el que se
muestra en la figura 2.43(d). Para obtener las ecuaciones que gobiernan a los
voltajes y corrientes ilustrados en la figura 2.43(d), de igual forma, se aplica
la LVK para las mallas I y II obteniendo lo siguiente:
2.6 Ejemplos 81

di1
L1 = 1 + E, (2.173)
dt
di2
L2 = 1 2 . (2.174)
dt
Mientras que, aplicando la LCK para los nodos A y B, se tiene:
d1 1
C1 = i1 i2 , (2.175)
dt R1
d2 2
C2 = i2 . (2.176)
dt RL
As, mediante inspeccion, al comparar las ecuaciones (2.161)-(2.162),
(2.165)-(2.166), (2.169)-(2.170) y (2.173)-(2.174), se producen como resul-
tado las ecuaciones que gobiernan el comportamiento de i1 e i2 , determinadas
respectivamente por (2.177) y (2.179). Realizando un proceso similar para las
variables 1 y 2 , determinadas por las ecuaciones (2.163)-(2.164), (2.167)-
(2.168), (2.171)-(2.172) y (2.175)-(2.176), se obtienen las ecuaciones (2.178)
y (2.180) respectivamente. De esta manera, el modelo matematico del converti-
dor Boost-Boost queda determinado por el sistema de ecuaciones diferenciales
de cuarto orden no lineal, siguiente:
di1
L1 = (1 u1 )1 + E, (2.177)
dt
d1 1
C1 = (1 u1 )i1 i2 , (2.178)
dt R1
di2
L2 = 1 (1 u2 )2 , (2.179)
dt
d2 2
C2 = (1 u2 )i2 . (2.180)
dt RL
As, las ecuaciones (2.177)-(2.180) constituyen el modelo matematico del con-
vertidor de potencia Boost-Boost. Si se desea corroborar que estas ecuaciones
reproducen los cuatro modos de operacion del convertidor (o circuitos equiva-
lentes de la figura 2.43), basta con asignarle los valores correspondientes a las
entradas u1 y u2 .
Con la finalidad de conocer las propiedades del convertidor de potencia
Boost-Boost en estado estacionario se parte de su modelo promedio asociado,
el cual se obtiene suponiendo que ambos transistores conmutan a alta frecuen-
cia y esta determinado como:

di1
L1 = (1 u1av )1 + E, (2.181)
dt
d1 1
C1 = (1 u1av )i1 i2 , (2.182)
dt R1
di2
L2 = 1 (1 u2av )2 , (2.183)
dt
82 2 Modelado matematico de sistemas fsicos

(a) Circuito equivalente del convertidor de potencia Boost-Boost


cuando u1 = 1 y u2 = 1.

(b) Circuito equivalente del convertidor de potencia Boost-Boost


cuando u1 = 1 y u2 = 0.

(c) Circuito equivalente del convertidor de potencia Boost-Boost


para u1 = 0 y u2 = 1.

(d) Circuito equivalente del convertidor de potencia Boost-Boost


cuando u1 = 0 y u2 = 0.

Figura 2.43. Modos de operacion del convertidor de potencia de CD/CD Boost-


Boost.

d2 2
C2 = (1 u2av )i2 , (2.184)
dt RL
donde i1 , 1 , i2 y 2 representan las corrientes y los voltajes promedio asocia-
dos a L1 , C1 , L2 y C2 respectivamente. Las entradas u1av y u2av representan
las entradas de control promedio, las cuales pueden tomar valores en el in-
tervalo continuo [0, 1), siendo estas las funciones de posicion promedio de los
interruptores.
De esta manera, partiendo del modelo promedio (2.181)-(2.184), se procede
a obtener los valores en estado estacionario del sistema que aparecen cuando
las entradas del convertidor u1av y u2av son constantes en algun valor dentro
del intervalo [0, 1). Esto se consigue suponiendo que ddti1 = 0, d di2
dt = 0, dt = 0
1
2.7 Caso de estudio 83
d2
y dt = 0, para encontrar:

0 (1 u1av ) 0 0 1 E
(1 u1av ) 1 1 0
R1 1 0 = ,
0 1 0 (1 u2av ) 2 0
0 0 (1 u2av ) R1L 2 0

Resolviendo para i1 , 1 , i2 y 2 , se obtiene lo siguiente:


E R1 +RL (1u2av )2
1 R1 RL (1u1av )2 (1u2av )2
1 E

= 1u1av . (2.185)
2 E 1

RL (1u1av )(1u2av )2
2 E
(1u1av )(1u2av )

De esta manera, (2.185) permite conocer de manera directa los valores que
toman las variables promedio i1 , 1 , i2 y 2 , en estado estacionario. Asi-
mismo, a partir de la ultima relacion en (2.185) se puede observar que la
salida satisface la desigualdad 2 E, pues recordemos que u1av [0, 1) y
u1av [0, 1).

2.7. Caso de estudio. Un convertidor electronico de


potencia de CD a CD tipo resonante serie de alta
frecuencia
Muchos equipos en la actualidad utilizan para su funcionamiento una
gran diversidad de circuitos electronicos los cuales, precisamente debido a su
gran diversidad, necesitan ser alimentados con diferentes niveles de voltaje de
corriente directa (CD). Para alimentar estos equipos se puede utilizar un gran
transformador que cuente con varias derivaciones en el secundario de modo
que a partir de cada una de ellas se pueda utilizar un arreglo rectificador-
filtro para obtener un voltaje de CD diferente. Sin embargo, este metodo ya
no es utilizado porque requiere de componentes (inductores y capacitores) de
valores grandes, resultando en equipos voluminosos, ademas de producir la
perdida de grandes cantidades de energa. La estrategia utilizada actualmente
para resolver este problema consiste en contar con varios circuitos electronicos
de potencia que mediante dispositivos de conmutacion obtienen, a su salida,
valores de voltaje de CD diferentes a partir de un unico voltaje de CD de
suministro. Estos circuitos reciben el nombre de convertidores electronicos de
potencia de CD a CD y resuelven el problema arriba mencionado reduciendo
las perdidas de energa y el volumen de los equipos. De hecho, la miniatu-
rizacion de los equipos electronicos modernos se debe en gran parte al uso
de convertidores electronicos de potencia. En los ejemplos 2.18 y 2.19 se han
modelado algunos de los convertidores electronicos de potencia utilizados en
la actualidad.
84 2 Modelado matematico de sistemas fsicos

i C

v -

+
L

+
E C0 R v0

(a) Serie
i i0
L0

+
L

+
v C0 R
E v0

- -

(b) Paralelo

Figura 2.44. Convertidores electronicos de potencia de CD a CD tipo resonante.

Otro tipo especial de convertidores electronicos de potencia son aquellos


que se denominan resonantes, los cuales se clasifican a su vez en serie y paralelo
segun la manera en que se conectan sus componentes (vease la figura 2.44).
En particular, el convertidor resonante serie de CD a CD mostrado en la
figura 2.44(a) funciona del siguiente modo. La red de conmutacion constituye
un inversor que entrega un voltaje de potencia alterno y cuadrado (que toma
valores de E) a la entrada del circuito resonante serie. En la forma mas basica
de funcionamiento de un convertidor resonante serie, la frecuencia de la senal
de voltaje entregada por el inversor es igual a la frecuencia de resonancia
del circuito serie LC. De este modo, los transistores con los que se construye
la red de conmutacion se encienden y apagan por parejas, Q1 , Q3 y Q2 , Q4 ,
cuando la corriente a traves de ellos es igual a cero (veanse los interruptores
en la parte izquierda de la figura 2.45; los diodos colocados en paralelo a los
transistores son utilizados cuando el circuito no funciona en resonancia tal
como se explica la seccion 3.11 del captulo 3). Esto es muy conveniente pues
evita la fatiga de los transistores alargando la vida util de los mismos. Por
otro lado, como el circuito LC serie funciona en resonancia, la corriente i a
traves del circuito adquiere una forma de onda sinusoidal la cual es rectificada
y filtrada por la parte derecha del circuito de la figura 2.44(a). De este modo,
la carga alimentada por el circuito (representada por la resistencia R) recibe
en sus terminales el voltaje de CD representado por v0 .
En la figura 2.46 se muestra el diagrama electrico de un convertidor reso-
nante serie de CD a CD presentando el inversor de manera simplificada como
2.7 Caso de estudio 85

L C
Q1 Q4 i +v
+ D1 D4 +

E
R v0
Q3
C0
Q2
D2 D3

Figura 2.45. Convertidor resonante serie de CD a CD mostrando la disposicion de


dispositivos en el inversor.

L C

v-

+
i
+

E(t)
- Co

v0

Figura 2.46. Circuito simplificado de un convertidor resonante serie de CD a CD.

una fuente de voltaje alterno y cuadrado E(t) que toma valores E. Notese
que, debido a la presencia de los diodos rectificadores, el funcionamiento del
circuito puede ser separado en dos casos: 1) cuando i > 0, figura 2.47(a), y
2) cuando i < 0, figura 2.47(b). A partir de la figura 2.47(a) se obtienen las
ecuaciones para i > 0. Aplicando la Ley de Kirchhoff de voltajes al trayecto
cerrado de la izquierda se obtiene:
di
E(t) = L
+ v + v0 , i > 0
dt
Es importante resaltar que se ha tomado en consideracion el sentido indicado
para la corriente i, as como la polaridad indicada para v0 . Por otro lado, de
acuerdo a (2.120) la relacion entre el voltaje y la corriente en el capacitor
resonante esta dada como:
dv
C = i, i > 0
dt
Finalmente, aplicando la Ley de Kirchhoff de corrientes al nodo comun a
ambos capacitores se obtiene:
86 2 Modelado matematico de sistemas fsicos

dv0 v0
i = C0 + , i>0
dt R

L C

+ -

+
i v
v0

+
E(t) - C0 R
-

(a) i > 0
L C

i +
v- -
+

E(t) - C0 R v0

+
(b) i < 0

Figura 2.47. Circuitos equivalentes para i > 0 e i < 0.

Por otro lado, a partir de la figura 2.47(b) se obtienen las ecuaciones para
i < 0. Aplicando la Ley de Kirchhoff de voltajes al trayecto cerrado de la
izquierda se obtiene:
di
E(t) = L + v v0 , i < 0
dt
Notese que v0 esta afectado por un signo porque la polaridad indica-
da para este voltaje esta en sentido opuesto al definido por el sentido de la
corriente electrica i. Sin embargo, la relacion entre el voltaje y la corriente en
el capacitor resonante no sufre cambios:
dv
= i, i < 0
C
dt
Finalmente, aplicando la Ley de Kirchhoff de corrientes al nodo comun a
ambos capacitores se obtiene:
v0 dv0
i= C0 , i<0
R dt
Notese que el sentido correcto de la corriente en el capacitor C0 y en la resis-
tencia es de la terminal marcada con + a la terminal marcada con , es
decir, es contrario al sentido indicado para i.
2.8 Resumen del captulo 87

Comparando estos dos conjuntos de ecuaciones, se puede obtener un unico


conjunto de ecuaciones que representa a ambos casos i > 0 e i < 0:
di
E(t) = L + v + v0 sign(i) (2.186)
dt
dv
C =i (2.187)
dt
dv0 v0
abs(i) = C0 + (2.188)
dt R
donde:

+1, i > 0
sign(i) = (2.189)
1, i < 0

mientras que abs(i) representa el valor absoluto de i, es decir abs(i) = i si


i > 0 y abs(i) = i si i < 0. Las ecuaciones en (2.186)-(2.188) constituyen
el modelo matematico del convertidor electronico de potencia de CD a CD
tipo resonante serie. En la seccion 3.11 del captulo 3 se retomara el estudio
de este tipo de convertidor electronico de potencia. A partir del estudio del
modelo (2.186)-(2.188) se vera como funciona este circuito y se explicara por
que recibe el calificativo de alta frecuencia. Para mas informacion sobre el
modelado de este tipo de convertidores electronicos de potencia se recomienda
consultar [10].

2.8. Resumen del captulo

El modelo matematico de un sistema fsico es una ecuacion o un conjunto


de ecuaciones diferenciales que describen la evolucion de las variables impor-
tantes del sistema fsico cuando son sometidas a condiciones especficas. Tal
descripcion sera obtenida mediante la solucion de dichas ecuaciones diferen-
ciales en el captulo 3.
Se ha mostrado que el modelo matematico de los sistemas mecanicos,
electricos y electromecanicos puede ser obtenido utilizando el concepto de
energa, cantidad fsica que los ingenieros estan acostumbrados a manejar. De
acuerdo a este enfoque, se puede considerar que las partes que componen a los
sistemas fsicos son procesadores de energa y el modelo matematico describe
como intercambian la energa dichos componentes.
Comparando la manera en que los sistemas procesan la energa se pueden
establecer analogas entre sistemas de diferente naturaleza. Por ejemplo, la
masa y la inercia (sistemas mecanicos) son analogas a la inductancia (sistemas
electricos), un resorte (sistemas mecanicos) es analogo a un capacitor (sistemas
electricos), y la friccion viscosa (sistemas mecanicos) es analoga a la resistencia
(sistemas electricos). Ademas, una caja de engranes y una barra apoyada en
un punto (sistemas mecanicos) son analogas a un transformador (sistemas
88 2 Modelado matematico de sistemas fsicos

electricos), mientras que un sistema pinon-cremallera (sistemas mecanicos) es


analogo a un motor electrico (sistemas electromecanicos).
En lo que resta de la presente obra, el modelo matematico del sistema a
controlar sera utilizado para disenar un controlador (otra ecuacion diferencial
en general). El objetivo es que al conectar el controlador en realimentacion
con el sistema a controlar se genere otra ecuacion diferencial (en lazo cerrado)
cuyas propiedades (estudiadas en el captulo 3) aseguren que la variable que
interesa controlar evolucione en el tiempo de la manera deseada.

2.9. Preguntas de repaso


1. Cuales son las leyes fundamentales de la fsica que se usan para describir
la interconexion de componentes en sistemas mecanicos y en sistemas
electricos?
2. Por que el modelo obtenido en el ejemplo 2.7 es una ecuacion diferen-
cial de primer orden mientras que el modelo obtenido en el ejemplo 2.8
esta constituido por dos ecuaciones diferenciales de segundo orden cada
una? Notese que en el ejemplo 2.7 hay tres cuerpos mientras que en el
ejemplo 2.8 hay dos cuerpos involucrados.
3. Por que el modelo en (2.92) no tiene el termino correspondiente a 4 , es
decir, a la posicion?
4. Por que los modelos matematicos de un circuito RL y de un circuito
RC son ecuaciones diferenciales de primer orden mientras que el modelo
matematico de un circuito RLC es una ecuacion diferencial de segundo
orden?
5. En la seccion 2.2.3 se menciona que Faraday fue el primero en darse cuen-
ta de que un inductor (y en general cualquier circuito electrico suficien-
temente largo) tiene propiedades analogas a las que tiene el momentum
en sistemas mecanicos. Puede explicar a que se refiere esta afirmacion?
Ha observado que cuando se trata de desconectar un circuito altamente
inductivo salta una chispa? Recuerda lo que establece la Primera Ley de
Newton?
6. Se ha visto que en un motor electrico de CD se cumple que ke = km . Por
otro lado, es claro que el subsistema electrico debe transmitir energa al
subsistema mecanico para realizar el movimiento. Puede dar el ejemplo
de una situacion en la que el subsistema mecanico transmite energa al
subsistema electrico? Que papel juega en este caso el hecho de que ke =
km ?
7. Se ha visto que una caja de engranes es analoga al transformador electrico
Podra listar las caractersticas existentes entre las corrientes y voltajes
en ambos devanados de un transformador electrico? Algo similar puede
establecerse para las velocidades y pares en ambos lados de la caja de
engranes? Podra listar las ventajas, desventajas y aplicaciones de estas
caractersticas en una caja de engranes y en un transformador electrico?
2.10 Ejercicios propuestos 89

8. De acuerdo a la pregunta anterior Por que un automovil debe viajar mas


lentamente para subir una pendiente muy pronunciada pero puede viajar
mas rapido en terrenos planos?
9. Si un transformador electrico puede elevar el voltaje eligiendo una ta-
za n1 /n2 apropiada Por que se usan circuitos electronicos basados en
transistores para amplificar senales en sistemas de comunicaciones (que
procesan corriente alterna) en lugar de transformadores electricos?
10. Si un transformador electrico y una caja de engranes conservan la potencia
en ambos puertos De que manera intervienen las perdidas en ambos
dispositivos? A que se pueden deber dichas perdidas?

2.10. Ejercicios propuestos


1. Considere el sistema masa-resorte-amortiguador mostrado en la figura
2.22(a) y estudiado en el ejemplo 2.3. Ahora suponga que este mecanismo
esta girado 90 en sentido horario, es decir, que ahora existe el efecto de
la gravedad sobre la direccion del desplazamiento del resorte y del amorti-
guador (la masa cuelga del techo a traves del resorte y del amortiguador).
Demuestre que el modelo matematico correspondiente es:
b K 1
y + y + y = F (t)
m m m
donde y = x x0 con x0 = mg/K y g la aceleracion de la gravedad.
Que significa esto?
2. Considere el sistema mecanico del ejemplo 2.9. Suponga que sobre el cuer-
po de la derecha se aplica un par externo de perturbacion Tp (t). Tambien
suponga que el par externo aplicado T (t) es producido por un motor
electrico de CD como en el ejemplo 2.12. Obtenga el modelo matematico
correspondiente y comparelo con el obtenido en (9.9) y (9.10) del captulo
9.
3. Realice las manipulaciones algebraicas que sobre el modelo (2.114) y
(2.115) se sugieren en el ultimo parrafo del ejemplo 2.12.
4. Realice las manipulaciones algebraicas del ejercicio anterior sobre el mo-
delo obtenido en el ejercicio 2 de esta seccion.
5. Considere el circuito electrico mostrado en la figura 2.48. Demuestre que
el voltaje v indicado en la figura es igual a:
1
v= (v1 v2 )
2

6. Considere el circuito RC mostrado en la figura 2.49. Demuestre que el


voltaje en la resistencia esta dado como:
s vc (0)
Vo (s) = 1 Vi (s) 1
s + RC s + RC
90 2 Modelado matematico de sistemas fsicos

donde Vo (s) y Vi (s) son las transformadas de Laplace de vo y vi , mientras


que vc (0) es el voltaje inicial (cuando t = 0) en el capacitor.
7. Un voltmetro analogico de corriente directa es basicamente un motor de
CD con un resorte firmemente unido entre su eje de giro y un punto fijo
a la parte no movil del voltmetro. Esto significa que dicho motor de CD
esta restringido a girar menos de una vuelta. En base a esta descripcion
obtenga el modelo matematico de un voltmetro analogico de CD.
8. Considere el sistema conmutado mostrado en la figura 2.50, el cual repre-
senta a un convertidor de potencia de CD/CD tipo Buck. Esta topologa
tambien es conocida como reductora de voltaje, porque la salida de voltaje
es menor o igual que el voltaje de entrada E, i.e., E. El objetivo de
control de este sistema consiste en conseguir que el voltaje de salida del
convertidor , se estabilice a un valor de voltaje deseado E, mediante
el diseno adecuado de u.
Demuestre que el modelo matematico del convertidor de potencia de
CD/CD Buck, esta determinado por:
di
L = + uE
dt

R R

+
v1 v v2
+

Figura 2.48. Circuito del ejercicio 5.

C
+

+ vo
vi R

Figura 2.49. Circuito RC.


2.10 Ejercicios propuestos 91

Q
L
i
E D v C R

(a) Construccion del convertidor mediante


transistor-diodo.

i L
u
E v C R
u
(b) Representacion ideal del convertidor.

Figura 2.50. Diagrama electronico del convertidor de potencia de CD/CD Buck.

d
C = i (2.190)
dt R
Las variables i, representan la corriente presente en el inductor L y el
voltaje entre las terminales del capacitor C, respectivamente. Mientras
que E representa el voltaje de entrada al sistema y R es la resistencia de
salida del sistema. Finalmente, la variable u denota la funcion de posicion
del interruptor o conmutador, la cual actua como variable de control y
solo toma el valor de 0 o de 1.
9. El sistema Convertidor de potencia Buck-Motor de CD, mostrado en la
figura 2.51, representa una forma de conveniente de alimentar a un motor
de CD. El objetivo de control de este sistema consiste en lograr que la
velocidad angular de la flecha del motor , se estabilice a un valor de
velocidad deseada a traves del voltaje , obtenido del convertidor de
potencia Buck, mediante el diseno adecuado de u.
Partiendo del hecho de que el modelo matematico de un motor de CD
esta determinado por:
dia
La = Ra ia ke ,
dt
d
J = km ia B.
dt
Demuestre que el modelo matematico del sistema Convertidor de potencia
Buck-Motor de CD, representado idealmente en la figura 2.51(b), esta de-
terminado por el siguiente sistema de ecuaciones diferenciales lineales:
di
L = + Eu, (2.191)
dt
d
C = i ia ,
dt R
92 2 Modelado matematico de sistemas fsicos

dia
La = Ra ia ke ,
dt
d
J = km ia B.
dt
donde:
i es la corriente presente en el inductor del convertidor Buck.
es el voltaje de salida del convertidor y a su vez es el voltaje aplicado
en las terminales de armadura del motor.
u representa la funcion de posicion del interruptor o conmutador, la
cual actua como variable de control y solo toma el valor de 0 o de 1.
L denota la inductancia del convertidor Buck.
C representa la capacitancia del convertidor Buck.
E es el voltaje de alimentacion del sistema convertidor Buck-Motor de
CD.
R denota la resistencia de salida del convertidor.
ia es la corriente electrica de armadura.
es la velocidad angular del rotor del motor.
La representa la inductancia de armadura.
Ra es la resistencia de armadura.

D !

Convertidor Buck Motor de CD

(a) Construccion del sistema convertidor Buck-Motor de CD


mediante transistor-diodo.

Convertidor Buck Motor de CD


(b) Representacion ideal del sistema convertidor Buck-
Motor de CD.

Figura 2.51. Diagrama electronico del sistema convertidor de potencia de CD/CD


Buck-Motor de CD.
2.10 Ejercicios propuestos 93

J es la inercia del rotor del motor.


ke representa la constante de fuerza contra-electromotriz.
km representa la constante de par del motor.
B es la constante de friccion viscosa del motor.
10. Considere el circuito RLC en serie del ejemplo 2.14, cuyo modelo ma-
tematico esta dado en (2.123). La Energa almacenada en el circuito es
igual a la energa magnetica de el inductor mas la energa electrica en el
capacitor E = 12 Li2 + 2C1 2
q . Compruebe que E = ivi Ri2 . Que significa
cada termino de esta expresion?
11. Considere el sistema inercia-resorte-amortiguador del ejemplo 2.6, cuyo
modelo matematico esta dado en (2.68). La Energa almacenada en el
sistema es igual a la energa cinetica mas la energa en el resorte E =
1 2 1 2 2
2 I + 2 K . Compruebe que E = T b . Que significa cada termino
de esta expresion?
12. Considere el modelo en (2.114),(2.115), correspondiente al sistema electro-
mecanico del ejemplo 2.12. La energa almacenada en este sistema es igual
a la energa magnetica en el inductor de armadura mas la energa cinetica
del mecanismo. Puede proceder como en los dos ejemplos previos para
encontrar la expresion correspondiente a dE dt ? Que significa cada uno de
los terminos que aparecen en dE dt ? Puede identificar a los terminos que
representan el intercambio de energa entre los subsistemas electrico y
mecanico?
Referencias

1. P.E. Wellstead, Physical system modelling, Academic Press, Londres, 1979.


2. M. Alonso and E.J. Finn, Fsica, Addison-Wesley Iberoamericana, Wilmington,
Delaware, 1995.
3. R.K. Wangsness, Campos Electromagneticos, Limusa-Noriega Editores, Mexico,
D.F., 1987.
4. R. Kelly, J. Llamas, and R. Campa, A measurement procedure for viscous and
coulomb friction, IEEE Transactions on Instrumentation and Measurement, vol.
49, no. 4, pp. 857-861, 2000.
5. C.T.A. Johnk, Teora electromagnetica: campos y ondas, Limusa-Noriega Edi-
tores, Mexico, D.F., 1993.
6. N.S. Nise, Sistemas de control para ingeniera, 1a. edicion en espanol, 1a. Re-
impresion, CECSA, Mexico, 2004.
7. F. W. Sears, M. W. Zemansky y H. D. Young, Fsica Universitaria, 6a. Edicion,
Addison-Wesley Iberoamericana, Wilmington, Delaware, 1988.
8. M.E. Van Valkenburg, Analisis de redes, Limusa-Noriega Editores, Mexico, D.F.,
1994.
9. W. H. Hayt y J. E. Kemmerly, Analisis de circuitos en ingeniera, McGraw-Hill,
Mexico, D.F., 1985.
10. R. Silva Ortigoza, Control de convertidores resonantes mediante planitud dife-
rencial: diseno y construccion, Tesis Maestra en Ciencias, CINVESTAV-IPN
(Zacatenco), Febrero (2002).
3
Base matematica: ecuaciones diferenciales

E(t)
50

[V] 0

-50

0 0.5 1 1.5 2
t [s] x 10
-4
30
P(t)
20
[Watt]

10

0
0 2 4 6 8
t [s] x 10
-4
1.5
i(t)
0.5
[A]

-0.5
v(t)

-1.5
-500 -250 0 250 500
[V]

Las ecuaciones diferenciales describen el comportamiento de los sistemas


fsicos y de los sistemas de control en lazo cerrado. Por ejemplo, en los cir-
cuitos electricos y electronicos, resolviendo las ecuaciones diferenciales corres-
pondientes se puede contar con una descripcion cuantitativa y cualitativa de
las corrientes en los inductores y los voltajes en los capacitores. A partir de
estos valores se pueden calcular otras variables importantes como la potencia
y la energa.
98 3 Base matematica: ecuaciones diferenciales

Objetivos del captulo


En el captulo 2 se ha mostrado que la evolucion de los sistemas fsicos que
interesa controlar en esta obra esta descrita por ecuaciones diferenciales ordi-
narias, lineales y de coeficientes constantes. Es de mucha utilidad identificar
cuales son las propiedades que determinan la forma de la solucion de este tipo
de ecuaciones diferenciales porque, segun se vera en captulos posteriores, el
diseno de un controlador consiste en construir un dispositivo que modifique
convenientemente esas propiedades para conseguir una respuesta satisfactoria.
El presente captulo pretende que el lector aprenda lo siguiente respecto de las
ecuaciones diferenciales ordinarias, lineales y de coeficientes constantes:
Que es la respuesta forzada y que es la respuesta natural, y que la solu-
cion completa de la ecuacion diferencial esta dada como la suma de estas
respuestas.
Como depende la solucion de la ecuacion diferencial de las races del po-
linomio caracterstico (o, equivalentemente, de los polos de la funcion de
transferencia).
Identificar graficamente como es la solucion de las ecuaciones diferencia-
les de primero y segundo orden e interpretar con ejemplos practicos el
significado de dichas formas graficas. A partir de este estudio, ser capaz
de comprender cuales son las posibles formas graficas de las ecuaciones
diferenciales de orden arbitrario.
Identificar cuales son las caractersticas que determinan la forma de la
respuesta transitoria, el valor final de la respuesta y la estabilidad de la
ecuacion diferencial.
Identificar el principio de superposicion como la propiedad fundamental
que determina la linealidad de una ecuacion diferencial.
Las tecnicas de control que se utilizan en esta obra requieren del modelo
matematico del proceso fsico a controlar. Estos modelos matematicos resul-
tan ser ecuaciones diferenciales. El diseno del controlador se realiza buscando
que la ecuacion diferencial que representa al sistema controlado en lazo cerra-
do tenga las propiedades matematicas que aseguran que el sistema de control
respondera como se desea. Por tanto, es importante saber cuales son las ca-
ractersticas de una ecuacion diferencial que determinan como es su solucion.
Aunque existen varios enfoques para estudiar ecuaciones diferenciales, sin em-
bargo el uso de la transformada de Laplace es el metodo preferido en la teora
de control clasico. Es por esta razon que en este captulo se estudian las ecua-
ciones diferenciales ordinarias, lineales, de coeficientes constantes usando la
transformada de Laplace.
La transformada de Laplace se define del siguiente modo. Suponga que
se tiene una funcion del tiempo f (t), la transformada de Laplace de f (t) se
representa por F (s) y se puede calcular como [2], pag. 185,[3], pag. 285:
Z
F (s) = L{f (t)} = f (t)est dt
0
3.1 Ecuacion diferencial de primer orden 99

El resultado fundamental de la transformada de Laplace que se utiliza en la


solucion de ecuaciones diferenciales ordinarias, lineales, de coeficientes cons-
tantes es el siguiente [2], pag. 192,[3], pag. 293:
( )
dn f (t)
L =
dtn
sn F (s) sn1 f (0) sn2 f (1) (0) sf (n2) (0) f (n1) (0) (3.1)

donde el exponente entre parentesis indica el orden de la derivada respecto al


tiempo. Tambien es util la siguiente propiedad [2], pag. 193,[3], pag. 293:
(Z )
t
F (s)
L f ( )d = (3.2)
0 s

Otro resultado importante es el teorema del valor final [1], pag. 25, [3], pag.
304:

lm f (t) = lm sF (s) (3.3)


t s0

expresion que es valida si dichos lmites existen.

3.1. Ecuacion diferencial de primer orden


Considere la siguiente ecuacion diferencial ordinaria, lineal, de coeficientes
constantes de primer orden:

y + a y = k u, y(0) = y0 (3.4)

donde k y a son constantes reales, y0 se conoce como el valor inicial o la con-


dicion inicial de y(t) y y = dy
dt . El objetivo de resolver esta ecuacion diferencial
es, conociendo los valores de a, k y de la funcion del tiempo u, obtener y co-
mo una funcion del tiempo que al ser sustituida en (3.4) satisfaga la igualdad
ah establecida. Usando (3.1) en (3.4) se obtiene:

sY (s) y0 + a Y (s) = k U (s) (3.5)

Despejando Y (s) se puede escribir:

k 1
Y (s) = U (s) + y0 (3.6)
s+a s+a
Para continuar es necesario especificar la funcion del tiempo u. Suponga que:
A
u = A, U (s) = (3.7)
s
100 3 Base matematica: ecuaciones diferenciales

donde A es una constante. Por tanto, ahora se puede escribir (3.6) como:
kA 1
Y (s) = + y0 (3.8)
s(s + a) s + a
De acuerdo al metodo de expansion en fracciones parciales [2], Cap. 4, [3],
pag. 319, si a 6= 0 entonces se debe escribir:
kA B C
= + (3.9)
s(s + a) s+a s
donde B y C son dos constantes. El valor de B se obtiene multiplicando ambos
lados de (3.9) por el factor (s + a) y evaluando las expresiones resultantes en
s = a:

kA B C
(s + a) = (s + a) + (s + a)
s(s + a) s=a s+a s=a s s=a

es decir:

kA kA
B= = (3.10)
s s=a a

El valor de C se calcula multiplicando ambos lados de (3.9) por el factor s y


evaluando las expresiones resultantes en s = 0:

kA B C
s = s + s
s(s + a) s=0 s + a s=0 s s=0

es decir:

kA kA
C= = (3.11)
s + a s=0 a

Sustituyendo (3.9), (3.10), (3.11) en (3.8) se tiene:


kA 1 kA 1 y0
Y (s) = + + (3.12)
a s+a a s s+a
A partir de tablas de transformadas de Laplace [4], cap. 32, se sabe que:
1
L{et } = (3.13)
s
donde es cualquier constante real. Usando (3.13) se encuentra que la trans-
formada inversa de Laplace de (3.12) esta dada como:
kA at kA
y(t) = e + + y0 eat (3.14)
a a
la cual constituye la solucion de (3.4).
3.1 Ecuacion diferencial de primer orden 101

Ejemplo 3.1 Para comprobar que (3.14) es la solucion de (3.4) se procede


del siguiente modo. Primero se obtiene la derivada de y(t) = kA
a e
at
+ kA
a +
at
y0 e , es decir:

y(t) = kAeat ay0 eat

y se sustituye y(t) e y(t) en (3.4) para obtener:



kA at kA
y(t) + ay(t) = kAeat ay0 eat + a e + + y0 eat = kA = ku
a a
porque en (3.7) se ha definido u = A. Esto significa que la expresion para
y(t) presentada en (3.14) satisface a (3.4) y, por tanto, se ha comprobado que
(3.14) es la solucion de (3.4). Este procedimiento debe seguirse para comprobar
la solucion de cualquier ecuacion diferencial.
La solucion dada en (3.14) se puede descomponer en dos partes:

y(t) = yn (t) + yf (t) (3.15)



kA
yn (t) = + y0 eat (3.16)
a
kA
yf (t) = (3.17)
a
donde yn (t) y yf (t) reciben los nombres de respuesta natural y respuesta
forzada, respectivamente.
La respuesta forzada yf (t) recibe este nombre porque es debida unica-
mente a la presencia de la funcion del tiempo u. Por otro lado, la respuesta
natural yn (t) recibe dicho nombre porque esta determinada unicamente por la
estructura (o naturaleza) de la ecuacion diferencial, es decir, por los terminos
y +ay presentes en el lado izquierdo de (3.4). Todo esto se explica del siguiente
modo. Considere el procedimiento de solucion previo suponiendo por un mo-
mento que y0 = 0. La expansion en fracciones parciales presentada en (3.9) y
la subsecuente aplicacion de la transformada inversa de Laplace muestran que
y(t) es obtenida como la suma de varias funciones del tiempo cuyas formas
dependen de las fracciones 1s y s+a 1
. Notese que la presencia de la primera
de estas fracciones, s , en (3.9) es debida a que U (s) = As esta presente en
1

(3.8) lo cual, a su vez, se debe a que u = A donde A es una constante. Notese


que la respuesta forzada yf (t) es una constante que resulta del termino kA 1
a s
1
en (3.12), es decir, tiene su origen en la fraccion s . Esto confirma que yf (t)
depende unicamente de la funcion del tiempo u. Por otro lado, la presencia de
1
la fraccion s+a es debida a los terminos y +ay ya que L{y +ay} = (s+a)Y (s).
De acuerdo a (3.13) esta fraccion da origen a la funcion eat que conforma a la
respuesta natural yn (t). Esto confirma que yn (t) esta determinada unicamente
por la estructura (o naturaleza) de la ecuacion diferencial. Una consecuencia
importante de este hecho es que yn (t) siempre estara dada en este ejemplo co-
mo una funcion de la forma eat sin importar cual sea el valor de u. El lector
102 3 Base matematica: ecuaciones diferenciales

puede repasar el procedimiento seguido para resolver la ecuacion diferencial y


darse cuenta que la condicion inicial y0 siempre aparecera en la solucion y(t)
como parte de la respuesta natural yn (t).
Antes de continuar, un poco de nomenclatura. En sistemas de control y
y u se conocen como la salida y la entrada, respectivamente. El polinomio
que surge de aplicar la transformada de Laplace a la ecuacion diferencial, es
decir s + a que tiene su origen en L{y + ay} = (s + a)Y (s), se conoce como
el polinomio caracterstico.
La solucion en (3.14) o, equivalentemente, en (3.15) puede tener uno de
los siguientes comportamientos.
1. Si a > 0, es decir si la raz del polinomio caracterstico s = a es negativa,
entonces lmt yn (t) = 0 y lmt y(t) = yf (t).
2. Si a < 0, es decir si la raz del polinomio caracterstico s = a es positiva,
entonces yn (t) y y(t) crecen sin lmite conforme el tiempo crece.
3. El caso en el que a = 0, es decir cuando la raz del polinomio caracterstico
esta en s = 0, no puede ser estudiado con las formulas desarrolladas
hasta aqu y se estudia como un caso especial en la siguiente seccion. Sin
embargo, con el fin de presentar un resumen de todos los casos, aqu se
anticipa lo que se va a encontrar en la siguiente seccion. Cuando la raz
del polinomio caracterstico esta en s = a = 0, la respuesta natural
permanece constante yn (t) = y0 , t 0 y la respuesta forzada es la
Rt
integral de la entrada yf (t) = k 0 u(t)dt.

Estudio grafico de la solucion

En esta seccion se estudia la forma grafica de la solucion en (3.15). De


acuerdo a lo que se acaba de estudiar, si a > 0 entonces la respuesta natu-
ral tiende a cero conforme el tiempo crece: lmt yn (t) = 0 y, por tanto,
para tiempos muy grandes la solucion de la ecuacion diferencial es igual a la
respuesta forzada unicamente: lmt y(t) = yf (t) = kA a . Esto significa que
mientras mas rapido desaparezca la respuesta natural yn (t) (lo cual ocurre
conforme a > 0 es mayor) mas rapido la solucion completa y(t) alcanzara a
la respuesta forzada yf (t). Por tanto, se puede pensar que la respuesta na-
tural es el medio que permite que la solucion completa y(t) transite desde el
valor inicial y(0) = y0 hasta la respuesta forzada yf (t). La existencia de tal
intermediario se justifica recordando que la solucion de la ecuacion diferencial
ordinaria en (3.4), es decir y(t), es una funcion continua del tiempo. Esto sig-
nifica que no pueden existir brincos discontinuos en y(t) y, por tanto, no se
puede saltar jamas desde el valor y(t) = y0 a y(t) = yf (t) 6= y0 en un intervalo
de tiempo de duracion cero.
En la figura 3.1 se muestra graficada la solucion en (3.15) cuando y0 = 0
y a > 0, es decir:
kA
y(t) = 1 eat (3.18)
a
3.1 Ecuacion diferencial de primer orden 103

Se define la constante de tiempo:


1
= (3.19)
a
como una medida de la rapidez con la que desaparece la respuesta natural, es
decir, la rapidez con la que y(t) alcanza a la respuesta forzada yf (t). Mediante
sustitucion directa de (3.19) en (3.18), es sencillo comprobar que:

kA
y( ) = 0.632 (3.20)
a
Finalmente, es importante senalar que y(t) crece sin lmite si a < 0. Si a = 0
entonces se tiene el caso estudiado en la seccion 3.2, es decir y(t) = kAt crece
sin lmite al aumentar el tiempo.

y(t)

kA
a

0:632 kA
a


tiempo

Figura 3.1. Estudio grafico de y(t) en (3.18).

Funcion de transferencia

Suponga que la condicion inicial es cero, y0 = 0, entonces (3.6) se puede


escribir como:
k
Y (s) = U (s)
s+a
104 3 Base matematica: ecuaciones diferenciales

o tambien:
Y (s) k
= G(s) = (3.21)
U (s) s+a

La funcion G(s) se conoce como la funcion de transferencia de la ecuacion


diferencial en (3.4). El polinomio que divide en G(s), es decir s + a, se conoce
como el polinomio caracterstico y sus races se conocen como los polos de
G(s). En este caso solo existe un polo en s = a. De acuerdo al estudio
previo se pueden hacer las siguientes afirmaciones en lo que se refiere a la
salida y(t) de la funcion de transferencia G(s):
Si el polo ubicado en s = a es negativo (a > 0) entonces al crecer
el tiempo la respuesta natural yn (t) desaparece y la respuesta total y(t)
alcanza a la respuesta forzada yf (t). Si u(t) = A es una constante, entonces
yf (t) = kA
a .
La rapidez con la que y(t) alcanza a yf (t) (rapidez con la que yn (t) de-
saparece) es mayor conforme el polo en s = a esta colocado mas hacia
la izquierda del punto s = 0. Esta rapidez se puede cuantificar usando la
constante de tiempo = a1 . Una constante de tiempo grande implica una
respuesta lenta y una constante de tiempo pequena implica una respuesta
rapida.
Si k = a > 0 entonces se dice que la funcion de transferencia G(s) es
de ganancia unitaria en estado estacionario, porque si u(t) = A es una
constante entonces se puede usar el teorema del valor final (3.3) para
encontrar que:
k A k
lm y(t) = lm sY (s) = lm s = A=A (3.22)
t s0 s0 s+a s a
En general, la ganancia en estado estacionario de la funcion de transferen-
cia en (3.21) se calcula como el cociente ka .
Si el polo ubicado en s = a es positivo (a < 0) entonces al crecer el
tiempo la respuesta total y(t) crece sin lmite. Notese que esto implica que
el polo esta colocado en el lado derecho del plano s (vease la figura 3.2).
El caso cuando el polo esta ubicado en s = a = 0, no puede ser estudiado
con las formulas desarrolladas hasta aqu y se estudia como un caso especial
en la siguiente seccion. Sin embargo, de nuevo, con el fin de presentar un
resumen de todos los casos aqu se anticipa lo que se va a encontrar en la
siguiente seccion. Cuando el polo esta ubicado en s = a = 0, la respuesta
natural no desaparece pero no crece
R t sin lmite y la respuesta forzada es la
integral de la entrada yf (t) = k 0 u(t)dt.

Ejemplo 3.2 Suponga que se tiene un tanque que almacena un lquido incom-
presible como el agua (vease la figura 3.3). El tanque es de paredes paralelas,
es decir de seccion constante cuya area es representada por C. El lquido es
3.1 Ecuacion diferencial de primer orden 105

Im (s)

a 0 a Re (s)
a>0 a<0

Figura 3.2. Ubicacion de polos de la funcion de transferencia en (3.21). Es costum-


bre representar un polo en el plano s usando una cruz .

introducido al tanque a razon de un flujo de entrada (en m3 /s) representa-


do por qi . El lquido sale del tanque a traves de una valvula de salida cuya
resistencia hidraulica es R. La rapidez con la que sale el lquido del tanque
esta dada por el flujo de salida (en m3 /s) el cual se representa por qo . El
nivel del agua dentro del tanque es h. El modelo matematico que describe este
sistema se obtiene a partir de la Ley de Conservacion de la Materia, ya que
al ser el agua incompresible esta ley puede ser expresada en terminos de la
masa o del volumen del agua. Suponga que durante un intervalo de tiempo de
duracion t, entra un volumen de lquido V (entra) y sale un volumen de
lquido V (sale). La rapidez con la que se incrementa el volumen de lquido
en el tanque durante ese intervalo de tiempo se puede calcular como:
V (dentro del tanque) V (entra) V (sale)
= (3.23)
t t t
Por otro lado, se tienen las siguientes relaciones:

V (dentro del tanque) = Ch


V (entra) = qi t
V (sale) = qo t

Sustituyendo en (3.23) y suponiendo pequenos incrementos tales que t dt,


h dh:
dh
C = qi qo (3.24)
dt
Por otro lado, si el flujo a traves de la valvula de salida es laminar, entonces
se cumple [1], pag. 155:
h
qo = (3.25)
R
Para entender el porque de esta expresion considere los siguientes casos.
106 3 Base matematica: ecuaciones diferenciales

qi

h
R qo

Figura 3.3. Sistema de nivel de lquido.

a) Suponga que la valvula de salida se mantiene con la misma abertura,


es decir que R se mantiene constante. Ahora suponga que aumenta el nivel
de lquido en el tanque, es decir que h crece. La experiencia y la expresion en
(3.25) nos indican que el flujo de salida qo aumenta bajo esta situacion.
b) Suponga que se mantiene constante el nivel de lquido h, usando una
bomba hidraulica para compensar exactamente el lquido que sale, y que se
cierra, poco a poco, la valvula de salida, es decir que R aumenta. La experien-
cia y la expresion en (3.25) indican que el flujo de salida qo disminuye bajo
esta situacion.
Sustituyendo (3.25) en (3.24):

dh h
C = qi
dt R
Entonces, el modelo matematico del sistema de nivel de la figura 3.3 queda
expresado como:
dh 1
C + h = qi
dt R
Dividiendo entre C, se puede expresar este modelo como la siguiente ecuacion
diferencial ordinaria, lineal, de coeficientes constantes, de primer orden:
dh
+ ah = kqi
dt
1 1
a= , k= (3.26)
RC C
La razon por la cual esta ecuacion diferencial es el modelo de este sistema
de nivel de lquido es porque mediante su solucion se puede conocer como
evoluciona el nivel h(t) en el tiempo, si se conocen el flujo del lquido que se
introduce qi (t), el area de la seccion del tanque C, si se tiene informacion a
cerca de que tan grande es la abertura de la vavula de salida, es decir si se
conoce R, y si se conoce el nivel inicial.
3.1 Ecuacion diferencial de primer orden 107

Ejemplo 3.3 Considere el tanque que contiene agua mostrado en la figura


3.3. En el ejemplo 3.2 se encontro que el modelo matematico correspondiente
es:
dh
+ ah = kqi
dt
1 1
a= > 0, k = (3.27)
RC C
Notese que esta ecuacion diferencial se puede escribir como la ecuacion en
(3.4) si se considera que y = h, u = qi y y0 = h0 . Esto significa que si qi = A,
entonces la solucion h(t) tiene la misma forma que (3.14), es decir:
kA at kA
h(t) = e + + h0 eat , h0 = h(0) (3.28)
a a
A continuacion se explica como la expresion en (3.28) describe correctamente
la evoluacion del nivel de lquido ante diferentes situaciones.
1. Suponga que el tanque esta inicialmente vaco (h0 = 0) y que se empieza
a introducir lquido con un flujo constante de valor A > 0. De acuerdo a
lo anteriormente expuesto, el nivel del lquido en el tanque h(t) es descrito
graficamente como en la figura 3.1 considerando que h(t) = y(t) (notese
1
que a = RC > 0). A partir de esta figura y la solucion en (3.28) se pueden
estudiar varios casos. Para comprobar que el comportamiento descrito en
(3.28) es correcto, el lector puede usar su experiencia previa para verificar
que lo descrito a continuacion verdaderamente se observa en un deposito
de agua:
Si A es mayor entonces el nivel final alcanzado por el lquido h() =
kA
a = RA tambien es mayor.
Si la valvula de salida se ajusta a con una abertura menor (R mayor)
entonces el nivel final alcanzado por el lquido lmt h(t) = kAa = RA
es mayor.
El area de la seccion transversal del tanque no tiene efecto en el valor
final del nivel alcanzado, es decir, el nivel final es igual para un tanque
muy delgado y para uno muy grueso.
Si el producto RC es mayor, entonces a es menor, por lo que la res-
puesta es mas lenta, es decir, debe transcurrir mas tiempo para al-
canzar el nivel h( ) = 0.632 kAa = 0.632RA y, por tanto, el nivel final
lmt h(t) = kA a = RA. Esto se debe a que la funcion eat tiende
1
a cero mas lentamente cuando a = RC > 0 es menor. Notese que un
valor grande de RC puede obtenerse incrementando C (el area de la
seccion transversal del tanque), es decir usando un tanque mas grueso,
o disminuyendo la abertura de la valvula de salida (aumentando R).
2. Suponga que no se introduce lquido al tanque, es decir, que qi (t) = A = 0
y que el tanque inicialmente contiene una cantidad determinada de agua,
es decir que h0 > 0. A partir de la solucion en (3.28) y usando la expe-
riencia del lector se puede verificar (vease la figura 3.4) que el nivel del
108 3 Base matematica: ecuaciones diferenciales

1
tanque decrece (notese que a = RC > 0) hasta que el tanque se vaca
lmt h(t) = 0. Esto ocurre mas rapido si el producto RC es menor
(cuando a es mayor) y mas lentamente cuando RC es mayor (cuando a
es menor).

h0
h(t)

R 1C 1 R 2C 2

tiempo

Figura 3.4. Comportamiento del nivel cuando h0 > 0 y qi (t) = A = 0 (R1 C1 <
R2 C2 ).

3. El caso cuando a < 0 no es posible en un sistema de nivel de lquido


porque C y R solo pueden ser positivas (no existen areas de secciones
transversales negativas ni aberturas negativas). Sin embargo, la situacion
en la que a < 0 ocurre con frecuencia en sistemas de control realimentados,
debido a la interconexion de diversos componentes.
4. El caso cuando a = 0 se estudia a continuacion.

3.2. Un integrador
Considere la siguiente ecuacion diferencial:
y = ku (3.29)
donde k es una constante real diferente de cero. Notese que esta ecuacion se
obtiene a partir de (3.4) cuando a = 0. Integrando directamente:
Z y(t) Z t
dy = ku dt
y(0) 0
Z t
y(t) = k u(t) dt + y(0) (3.30)
0
3.2 Un integrador 109

y(t) = yn (t) + yf (t)


Z t
yn (t) = y(0), yf (t) = k u(t) dt
0

En este caso yn (t) permanece constante cuando el tiempo crece. Notese que si
u = A es constante, entonces la respuesta forzada crece sin lmite yf (t) = kA t.
En la figura 3.5 se muestra graficada la solucion y(t) = y(0) + kA t, para los
casos a) y(0) 6= 0 y u = A =constante positiva, y b) y(0) 6= 0 y u = A = 0. A
los sistemas fsicos representados por este tipo de ecuacion diferencial se les
llama integradores porque, si y(0) = 0 la solucion y(t) (salida) es la integral
de la entrada u.
Ejemplo 3.4 Considere el tanque con agua mostrado en la figura 3.3. Su-
ponga que la valvula de salida esta totalmente cerrada por lo que R .
Entonces, el modelo en (3.26) se reduce a:

dh
= kqi
dt
1
porque a = RC 0 cuando R . Entonces, la evolucion del nivel en el
tiempo esta descrita por (3.30), es decir:
Z t
h(t) = h(0) + k qi (t) dt
0

Por tanto, el sistema de nivel de lquido se comporta en este caso como un


integrador. Si qi = A > 0, entonces:

h(t) = h(0) + kAt (3.31)

Se puede hacer uso de la figura 3.5, haciendo h(t) = y(t) y qi (t) = u, para
apreciar graficamente la solucion en (3.31) en los casos i) h(0) > 0 y qi =
A =constante positiva, e ii) h(0) > 0 y qi = A = 0. Notese que el nivel
permanece constante si no se introduce lquido (cuando A = 0) y que el nivel
crece sin lmite cuando A > 0 es constante. El lector puede usar su experiencia
previa para comprobar que estas dos situaciones verdaderamente suceden en
un sistema de nivel de lquido real.
Ejemplo 3.5 La ecuacion diferencial en (3.29) tambien puede resolverse
usando expansion en fracciones parciales, es decir, usando el metodo de la
seccion 3.1. Usando (3.1) en (3.29) se obtiene:

sY (s) y0 = k U (s)

Despejando Y (s) se puede escribir:

k 1
Y (s) = U (s) + y0 (3.32)
s s
110 3 Base matematica: ecuaciones diferenciales

y(t)

kA

y0

0
0
tiempo
(a) y0 6= 0 y u = A =constante positiva
y(t)

y0

tiempo
(b) y0 6= 0 y u = A = 0

Figura 3.5. Solucion de la ecuacion diferencial en (3.29).

Para continuar es necesario especificar la funcion del tiempo u. Suponga que:


A
u = A, U (s) =
s
donde A es una constante. Por tanto, ahora se puede escribir (3.32) como:
kA 1
Y (s) = + y0 (3.33)
s2 s
De acuerdo al metodo de expansion en fracciones parciales [2], Cap. 4, [3],
Cap 7, se debe escribir:
3.2 Un integrador 111

kA B C
2
= + 2 (3.34)
s s s
donde B y C son dos contantes. El valor de C se obtiene multiplicando ambos
lados de (3.34) por s2 y evaluando en s = 0, es decir:


2 kA B 2 C 2
s 2 = s + 2s
s s=0 s s=0 s s=0

De donde se obtiene que C = kA. Para calcular B se multiplican ambos lados


de (3.34) por s2 , se deriva una vez respecto a s y se evalua en s = 0:

d 2 kA
d B 2 d C 2
s 2 = s + s
ds s s=0 ds s s=0 ds s2 s=0

De donde se obtiene que B = 0. Por tanto, usando estos valores y (3.34) se


puede escribir (3.33) como:
kA 1
Y (s) = + y0 (3.35)
s2 s
A partir de tablas de transformadas de Laplace [4], cap. 32, se sabe que:
1
L{t} = (3.36)
s2
Usando (3.36) se encuentra que la transformada inversa de Laplace de (3.35)
esta dada como:

y(t) = kAt + y0 (3.37)

la cual constituye la solucion de (3.29). Esta solucion se puede descomponer


en dos partes:

y(t) = yn (t) + yf (t) (3.38)


yn (t) = y0
yf (t) = kAt

donde yn (t) y yf (t) reciben los nombres de respuesta natural y respuesta for-
zada, respectivamente.
Tal como se explico en la seccion 3.1, la respuesta natural yn (t) recibe
dicho nombre porque esta determinada unicamente por la estructura (o natu-
raleza) de la ecuacion diferencial, es decir, por la transformada de Laplace de
y presente en el lado izquierdo de (3.29). Esto da origen al termino 1s y0 en
(3.35), lo cual permite tener yn (t) = y0 en (3.38).
La respuesta forzada yf (t) es debida a la excitacion (entrada) u = A.
Sin embargo, en este caso la respuesta forzada tambien recibe el efecto de la
transformada de Laplace del termino y presente en el lado izquierdo de (3.29),
pues ambos generan el termino kA s2 , del cual se obtiene yf (t) = kAt.
112 3 Base matematica: ecuaciones diferenciales

El polinomio caracterstico de la ecuacion diferencial en (3.29) es s y, por


tanto, solo tiene una raz en s = 0. Por tanto, la funcion de transferencia
correspondiente G(s) (cuando y0 = 0):
Y (s) k
= G(s) = (3.39)
U (s) s

solo tiene un polo en s = 0. Notese que la entrada U (s) = As tambien tiene


un polo en s = 0. La combinacion de estos dos polos repetidos en (3.33)
produce una respuesta forzada de la forma yf (t) = kAt (un polinomio del
tiempo de primer grado), cuando la entrada es u = A (un polinomio del
tiempo de grado cero). Notese que la respuesta forzada correspondiente a la
ecuacion diferencial en (3.4) tiene la forma yf (t) = kA a (un polinomio del
tiempo de grado cero) cuando la entrada es u = A (un polinomio del tiempo
de grado cero). A partir de estos dos ejemplos se llega a la siguiente conclusion
importante:
La respuesta forzada de una ecuacion diferencial de primer orden excita-
da con una entrada constante, tambien sera constante si el polinomio carac-
terstico no tiene races en s = 0.
En la figura 3.2 se muestra la ubicacion en el plano s del polo de la funcion
de transferencia en (3.39), es decir, el polo en s = 0. El lector debe aprender a
relacionar la ubicacion en el plano s de los polos de la funcion de transferencia
correspondiente con la forma en el tiempo de la solucion y(t) correspondiente
(veanse los casos listados antes del ejemplo 3.2).

3.3. Ecuacion diferencial de segundo orden


Considere la siguiente ecuacion diferencial ordinaria, lineal, con coeficientes
constantes, de segundo orden:

y + 2n y + n2 y = kn2 u, y(0) = y0 , y(0) = y0 (3.40)

donde n y k son constantes reales positivas. Supongase que u = A es una


constante. Usando (3.1) y U (s) = A/s se puede escribir:

s2 Y (s) sy0 y0 + 2n (sY (s) y0 ) + n2 Y (s) = kn2 U (s)

para obtener:
n2 A y0 (s + 2n ) + y0
Y (s) = k + 2 (3.41)
(s2 + 2n s + n2 )s s + 2n s + n2
Suponga primero que las condiciones iniciales son cero y0 = 0, y0 = 0, enton-
ces:
A n2
Y (s) = k
(s2 + 2n s + n2 )s
3.3 Ecuacion diferencial de segundo orden 113

Suponga tambien que 0 < 1 es una constante real, entonces:

s2 + 2n s + n2 = (s a)(s a) (3.42)

a = + jd , a = jd , j = 1
p
d = n 1 2 > 0, = n 0

Ahora, notese que:

s2 + 2n s + n2 = (s [ + jd ])(s [ jd ]) = (s )2 + d2

De acuerdo al metodo de expansion en fracciones parciales [2], cap. 4, [3], cap.


7, en este caso se debe escribir:
An2 An2 Bs + C D
Y (s) = k = k = +
(s2 + 2n s + n2 )s [(s )2 + d2 ]s (s )2 + d2 s
(3.43)

donde B, C y D son constantes que deben ser calculadas. La transformada


inversa de (3.43) esta dada como:
" #
en t
y(t) = kA 1 p sin (d t + ) (3.44)
1 2
p
1 2
= arctan

Que constituye la solucion de (3.40) cuando las condiciones iniciales son cero
y0 = 0, y0 = 0. A continuacion se presenta el procedimiento detallado que se
utiliza para obtener (3.44) a partir de (3.43). El lector que no este interesado
en los detalles tecnicos de este procedimiento puede pasar directamente a la
ecuacion (3.49).
Multiplicando ambos miembros de (3.43) por el factor (s )2 + d2 y
evaluando en s = a (vease (3.42)) se puede escribir:

An2 2 2
Bs + C 2 2

k 2 [(s ) + d ] = 2 [(s ) + d ]
[(s )2 + d ]s s=a
(s )2 + d s=a

D
+ [(s )2 + d2 ]
s s=a

para obtener:
An2
k = B( + jd ) + C
+ jd
Multiplicando el lado izquierdo por ( jd )/( jd ):
( jd )
kAn2 = B + C + jBd
2 + d2
114 3 Base matematica: ecuaciones diferenciales

Igualando partes imaginarias se tiene:


kAn2
B= (3.45)
2 + d2
Igualando partes reales se tiene:
kAn2
B + C =
2 + d2
Sustituyendo (3.45):
2kAn2
C= (3.46)
2 + d2
Usando (3.45) y (3.46) se puede escribir:
kA 2 2kA 2
Bs + C 2 +n2 s + 2 +n2
= d d

(s )2 + d2 (s )2 + d2
kAn2 (s ) kAn2 1
= +
( + d ) [(s ) + d ] ( + d ) [(s )2 + d2 ]
2 2 2 2 2 2

Usando las transformaciones inversas [4], cap. 32:


( )
s
L1 = et cos(d t)
(s )2 + d2
( )
d
L1
= et sin(d t)
(s )2 + d2

se obtiene:
( )
Bs + C kAn2 t kAn2
L1 = e cos( d t) + et sin(d t)
(s )2 + d2 2
2 + d d ( 2 + d2 )
kAn2 t
= e [ cos(d t) + sin(d t)]
2 + d2 d
s
2
kAn2 t
= e [sin cos(d t) + cos sin(d t)] +1
2 + d2 d
Notese que en el ultimo paso se han usado algunas relaciones de la figura
3.6(a). Por otro lado, se puede seguir reduciendo:
1
sin cos(d t) + cos sin(d t) = [sin( d t) + sin( + d t)] +
2
1
+ [sin(d t ) + sin(d t + )]
2
= sin(d t + )
3.3 Ecuacion diferencial de segundo orden 115

=! d

CA
1 ( )
2 + 1
r
CO
!d ( )

(a) (b)

Figura 3.6. Relaciones importantes para el ejemplo de la seccion 3.3.

porque sin(x) = sin(x). Con esto se obtiene:


r
2
( )
+1
Bs + C 2
d
L1 = kA n et sin(d t + )
(s )2 + d2 2 + d2

Por otro lado, de la figura 3.6(a):


1 1 1
tan = = p =
/d 2
(n )/(n 1 )
1 2
p
1 2
= + arctan

donde se ha tomado en consideracion el signo del cateto adyacente y del cateto
opuesto para determinar que representa un angulo en el tercer cuadrante
(ver figura 3.6(b)). Esto permite hacer la siguiente simplificacion [4], cap. 5:

sin(d t + ) = sin (d t + + )
= sin (d t + )
p
1 2
= arctan

por lo que ahora se puede reescribir:
r 2
( )
+1
Bs + C d
L1 = kAn2 et sin (d t + )
(s )2 + d2 2 + d2
p
2 + d2 t
= kAn2 e sin (d t + )
d ( 2 + d2 )
1
= kAn2 p et sin (d t + )
d 2 + d2
116 3 Base matematica: ecuaciones diferenciales
( )
Bs + C 1
L1
= kA p et sin (d t + ) (3.47)
(s )2 + d2 1 2
p
donde se ha usado = n y d = n 1 2 . Por otro lado, el valor de
D en (3.43) se obtiene facilmente multiplicando ambos miembros de dicha
expresion por el factor s y evaluando en s = 0:

kA n2

D= 2 = kA (3.48)
s + 2n s + n s=0
2

Usando (3.43), (3.47) y (3.48) se encuentra la solucion buscada:


" #
en t
y(t) = kA 1 p sin (d t + )
1 2

Si ahora se considera que las condiciones iniciales no son cero entonces:


" #
en t
y(t) = kA 1 p sin (d t + ) + p(t) (3.49)
1 2

donde:

1 y0 (s + 2n ) + y0
p(t) = L (3.50)
s2 + 2n s + n2

La transformacion inversa de Laplace que define a p(t) puede ser obtenida


usando un procedimiento similar al que se acaba de mostrar. Mas aun, el
lector puede darse cuenta que p(t) esta dada por una funcion de la forma
presentada en (3.47) y que su coeficiente depende de y0 y y0 .
La solucion dada en (3.44) se puede descomponer en dos partes:

y(t) = yn (t) + yf (t) (3.51)


n t
e
yn (t) = kA p sin (d t + ) (3.52)
1 2
yf (t) = kA (3.53)

donde yn (t) y yf (t) constituyen la respuesta natural y la respuesta forzada,


respectivamente. Notese que de acuerdo a (3.43) y (3.47), la respuesta natural
en (3.52) es debida unicamente a la estructura (o naturaleza) de la ecuacion
diferencial pues depende del polinomio caracterstico s2 + 2n s + n2 = (s
)2 + d2 que resulta de aplicar la transformada de la Laplace al termino
y + 2n y + n2 y. As que sin importar cual sea el valor de u, la respuesta
natural yn (t) tendra la forma presentada en (3.52). Por otro lado, notese que
la respuesta forzada en (3.53) debe su origen al termino D/s en (3.43) el
cual, a su vez, es introducido por la presencia de la funcion constante u = A,
3.3 Ecuacion diferencial de segundo orden 117

ya que U (s) = A/s. Notese que de acuerdo al parrafo que sigue a (3.50),
cuando las condiciones iniciales son diferentes de cero estas solo afectan a la
respuesta natural en el sentido de que su coeficiente se vera afectado por las
condiciones iniciales y0 y y0 , pero la forma de la funcion del tiempo siempre
sera en t sin (d t + ). De hecho, p(t) forma parte de la respuesta natural
cuando las condiciones iniciales son diferentes de cero.
El lector puede revisar el procedimiento presentado despues de (3.44) para
comprobar que en el caso en que 1 < < 0 con k y n positivos, la solucion
en (3.51) o, equivalentemente, en (3.44) se transforma en:

y(t) = yn (t) + yf (t) (3.54)


p !!
en t 1 2
yn (t) = kA p sin d t arctan
1 2 abs()
yf (t) = kA

donde abs() representa la funcion valor absoluto.


Utilizando (3.51) cuando 0 < 1 y (3.54) cuando 1 < < 0 se
concluye que la solucion de la ecuacion diferencial en (3.40) tiene uno de los
siguientes comportamientos.
1. Si 0 < < 1, es decir si las dos races del polinomio caracterstico, ubi-
cadas en s = n jd , tienen parte real negativa n < 0, entonces
lmt yn (t) = 0 y lmt y(t) = yf (t).
2. Si 1 < < 0, es decir si las dos races del polinomio caracterstico,
ubicadas en s = n jd , tienen parte real positiva n > 0, entonces
yn (t) y y(t) crecen sin lmite, de manera oscilatoria, conforme el tiempo
crece.
3. Si = 0, es decir si las dos races del polinomio caracterstico, ubicadas
en s = n jd , tienen parte real cero n = 0, entonces de (3.51)
se obtiene:

y(t) = yn (t) + yf (t) (3.55)


yn (t) = kA cos(n t), yf (t) = kA

cuando las condiciones iniciales son cero, es decir, yn (t) es una funcion
oscilatoria cuya amplitud no aumenta pero tampoco disminuye. Esto sig-
nifica que aunque y(t) no crece sin lmite, sin embargo no alcanzara de
manera permanente a la respuesta forzada yf (t).
4. El comportamiento obtenido cuando esta fuera del rango 1 < < 1 es
estudiado en las secciones que siguen bajo los casos en los que las races
del polinomio caracterstico son reales y repetidas o reales y diferentes.
Finalmente, notese que de acuerdo a lo anteriormente expuesto y a (3.49),
(3.50), la solucion de una ecuacion diferencial de segundo orden puede pre-
sentar oscilaciones sostenidas ( = 0) aun cuando la entrada o excitacion sea
cero (u = 0) si las condiciones iniciales son diferentes de cero. Esto explica el
118 3 Base matematica: ecuaciones diferenciales

funcionamiento de los circuitos osciladores presentados en el captulo 8 (vease


el ultimo parrafo de la seccion 8.3.1).

Estudio grafico de la solucion


A continuacion se estudia de manera grafica la solucion presentada en
(3.51) para la ecuacion diferencial en (3.40). Recuerdese que se supone que
0 < 1, que n , k son constantes positivas y que las condiciones iniciales
son cero y0 = 0, y0 = 0. Notese que la respuesta natural tiende a cero conforme
el tiempo crece si 0 < < 1:
!
en t
lm yn (t) = lm kA p sin (d t + ) = 0 (3.56)
t t 1 2
porque n > 0. Recuerdese tambien que en el caso en que las condiciones
iniciales no son cero, la respuesta natural tambien tiende a cero al crecer
el tiempo. Por tanto, para tiempos muy grandes la solucion de la ecuacion
diferencial es igual a la respuesta forzada unicamente:
lm y(t) = yf (t) = kA (3.57)
t

Esto significa que mientras mas rapido desaparezca la respuesta natural yn (t)
(lo cual ocurre conforme el producto n > 0 es mayor) mas rapido la solucion
completa y(t) alcanzara a la respuesta forzada yf (t). Tal como se menciono pa-
ra las ecuaciones diferenciales de primer orden, la respuesta natural permite
que la respuesta total y(t) transite de manera continua desde el valor dictado
por las condiciones iniciales (iguales a cero en este caso) hasta la respuesta
forzada yf (t).
Dos caractersticas importantes de la respuesta en (3.51) son el tiempo de
subida tr y el sobre paso Mp , las cuales se indican en la figura 3.7. La manera
de medir el sobre paso es mediante la expresion:
yp yf
Mp ( %) = 100 (3.58)
yf
donde yf = kA representa la respuesta forzada. Recuerdese que se supone que
y0 = y0 = 0. A partir del analisis detallado de la expresion en (3.51) se puede
demostrar que [1], pag. 232:
" p !#
1 1 2
tr = arctan (3.59)
d


Mp ( %) = 100 e 1 2

En las figuras 3.8 y 3.9 se muestra como se ve afectada la solucion en (3.51)


cuando los parametros y n cambian. Notese que el sobre paso Mp es afec-
tado exclusivamente por mientras que el tiempo de subida tr es afectado
principalmente por n , aunque tambien tiene un pequeno efecto sobre tr .
3.3 Ecuacion diferencial de segundo orden 119

y(t)

yp

yf

tr
tiempo

Figura 3.7. Caractersticas de y(t) en (3.51).

Finalmente, es importante senalar que cuando u = A = 0 pero alguna de


las condiciones iniciales y0 o y0 es diferente de cero, la forma de la respuesta
y(t) es como la funcion del tiempo en (3.52) y su aspecto grafico es como
la parte oscilatoria sin la componente constante (alrededor de y = 0) en
cualquiera de las figuras 3.7, 3.8 o 3.9. Esto es debido a la funcion p(t) que
aparece en (3.49).

Funcion de transferencia

Suponga que las condiciones iniciales son y0 = 0, y0 = 0, entonces (3.41)


se puede escribir como:

kn2
Y (s) = U (s) (3.60)
s2 + 2n s + n2

o tambien:
Y (s) kn2
= G(s) = 2 (3.61)
U (s) s + 2n s + n2

donde G(s) es la funcion de transferencia de la ecuacion diferencial en (3.40).


Notese que G(s) definida en (3.61) tiene un polinomio caracterstico (polino-
mio en el denominador) de segundo grado por lo que G(s) tiene dos polos
120 3 Base matematica: ecuaciones diferenciales

y(t)
2kA
=0

0:1

0:2

0:3
0:4
0:5
0:6
kA
0:7
1:0

2:0

tiempo

Figura 3.8. Efecto sobre la solucion en (3.51) al usar diferentes valores de . El


valor de n permanece constante.

(races del polinomio caracterstico). Por tanto, G(s) es una funcion de trans-
ferencia de segundo orden. De acuerdo a (3.42) estos polos estan ubicados en
s = a y en s = a, donde:

a = + jd , a = jd

Es importante subrayar que estos polos son complejos conjugados solo bajo la
suposicion de que 1 < < 1. El lector puede verificar que los polos son reales
si no satisface la condicion anterior. Ese caso es estudiado en las secciones
que siguen.
De acuerdo al estudio realizado en las secciones previas se pueden hacer
las siguientes afirmaciones en lo que se refiere a la salida y(t) de la funcion de
transferencia G(s):
Si los polos tienen parte real negativa = n < 0, es decir > 0,
entonces al crecer el tiempo la respuesta natural yn (t) desaparece y la
respuesta total y(t) alcanza a la respuesta forzada yf (t). Cuando la entrada
es una constante u(t) = A, entonces la respuesta forzada es yf (t) = kA.
La rapidez con la que yn (t) desaparece es mayor conforme el producto n
es mayor. En la figura 3.10 se muestra como la respuesta del sistema de
segundo orden permanece envuelta por dos funciones exponenciales cuya
rapidez de decaimiento esta determinada por el producto n .
3.3 Ecuacion diferencial de segundo orden 121

y(t)
!n 3 !n 2 !n 1

kA

tiempo

Figura 3.9. Efecto sobre la solucion en (3.51) al usar diferentes valores de n :


n2 = 2n1 , n3 = 3n1 . El valor de permanece constante.

y(t)


e ! nt
kA 1 + p 1 2

kA


e ! nt
p
kA 1 1 2

tiempo

Figura 3.10. Envoltura exponencial de la respuesta de un sistema de segundo orden


ante una entrada constante cuando las condiciones iniciales son cero.
122 3 Base matematica: ecuaciones diferenciales

El tiempo de subida tr disminuye si se incrementa n . Esto se puede


comprobar al observar que si n aumenta entonces, de acuerdo a (3.42),
d aumenta y, de acuerdo a (3.59), tr disminuye.
El sobre paso Mp disminuye si aumenta.
De acuerdo a la figura 3.11: i) el tiempo de subida tr disminuye conforme
los polos complejos conjugados estan
p mas alejados de s = 0 porque n crece
(vease (3.59) junto con d = n 1 2 ), ii) el parametro aumenta (y
por tanto, el sobre paso Mp disminuye) conforme la ubicacion de los polos
complejos conjugados forma un angulo mayor porque = sin(), iii) la
rapidez con la que yn (t) desaparece es mayor conforme los polos complejos
conjugados estan ubicados mas hacia la izquierda del punto s = 0 porque
el producto n es mayor.
Si k = 1 entonces se dice que la funcion de transferencia G(s) es de ganan-
cia unitaria en estado estacionario, porque cuando u = A es una constante
se puede usar el teorema del valor final (3.3) para encontrar que:

kn2 A kn2
lm y(t) = lm sY (s) = lm s = A = A(3.62)
t s0 s0 s2 + 2n s + n2 s n2

La constante k representa la ganancia en estado estacionario de la funcion

Im (s)

j! d
!n

! n Re (s)

Figura 3.11. Uno de los polos de G(s) en (3.61) cuando 0 < < 1.

de transferencia en (3.61).
Si 1 < < 0 entonces la parte real de los polos = n es positiva por
lo que la respuesta total y(t) crece sin lmite al crecer el tiempo. Notese
que esto implica que los polos complejos conjugados se encuentran en el
lado derecho del plano s.
El coeficiente recibe el nombre de factor de amortiguamiento porque es
el que determina que tan oscilatoria es la respuesta y(t) (vease (3.59), para
el sobre paso, y la figura 3.8).
3.3 Ecuacion diferencial de segundo orden 123

La constante d se conoce como la frecuencia natural amortiguada porque,


de acuerdo a lo visto previamente (vease (3.51)), d es la frecuencia de
oscilacion de y(t) cuando el amortiguamiento es diferente de cero. Notese
que la frecuencia de oscilacion d es la parte imaginaria de los polos de la
funcion de transferencia en (3.61) (vease (3.42)).
La constante n se conoce como la frecuencia natural no amortiguada
porque, de acuerdo a (3.51) y (3.55), n es la frecuencia de oscilacion de
la respuesta cuando el amortiguamiento es cero.
Ejemplo 3.6 Considere el sistema masa-resorte-amortiguador mostrado en
la figura 3.12. En el ejemplo 2.3 de la seccion 2.6 en el captulo 2 se mues-
tra que la posicion x del carrito esta determinada por la siguiente ecuacion
diferencial de segundo orden:

mx = Kx bx + f (3.63)

donde K es la constante de rigidez del resorte, b es el coeficiente de friccion


viscosa del amortiguador, m es la masa del carrito y f es una fuerza externa.
La expresion en (3.63) se puede escribir como:

b K 1
x + x + x = f
m m m
lo cual, a su vez, se puede escribir como la expresion en (3.40):

x + 2n x + n2 x = kn2 f (3.64)
b K 1
2n = , n2 = , k =
m m K
donde x juega el papel de la salida y mientras que f juega el papel de la entrada
u. Por tanto, x(t) tiene la forma mostrada para y(t) en (3.51) si 0 < 1
cuando las condiciones iniciales son cero. Notese que todas las constantes
en (3.63) son positivas: la masa m, el coeficiente de friccion viscosa b y la
constante de rigidez del resorte K solo pueden ser positivas. De acuerdo a
(3.64), el factor de amortiguamiento esta dado como:

b
= (3.65)
2 mK
Por tanto, si se aplica una fuerza constante f = A se pueden usar los resul-
tados en las figuras 3.7, 3.8 y 3.9 para concluir lo siguiente.
Si no hay friccion, es decir si b = 0, entonces = 0 y el carrito osci-
1
lara permanentemente alrededor de la posicion xf = kA = K A. En el
caso en que la fuerza externa aplicada sea cero f = 0 pero alguna de las
condiciones iniciales x0 o x0 sea diferente de cero, entonces el carrito tam-
bien oscilara permanentemente pero alrededor de la posicion x = 0, como
lo describe la funcion p(t) que aparece en (3.49).
124 3 Base matematica: ecuaciones diferenciales

Si la friccion b > 0 se incrementa poco a poco, entonces > 0 tambien


se incrementa y el carrito oscilara cada vez menos veces porque el sistema
masa-resorte-amortiguador estara cada vez mas amortiguado (cuando =
1 el sistema tiene dos races reales repetidas y ya no presenta oscilaciones,
como se ve en las secciones siguientes). En todos estos casos, cuando el
1
carrito deje de oscilar se detendra en la posicion x = xf = kA = K A. En
el caso en que la fuerza externa aplicada sea cero f = 0 pero alguna de
las condiciones iniciales x0 o x0 sea diferente de cero, entonces el carrito
tambien oscilara cada vez menos (conforme > 0 se aproxima a 1) y
se detendra en la posicion x = 0. De nuevo, esto esta descrito por la
funcion p(t) que aparece en (3.49). Notese que de acuerdo a (3.65) el
amortiguamiento tambien aumenta si decrece la masa m o la constante
de rigidez del resorte K. Para entender la razon de esto considerese el
caso contrario: valores mayores de m y K producen fuerzas mas grandes
(mx para la masa y Kx para el resorte) que, por tanto, pueden vencer con
mayor facilidad a la fuerza de friccion (bx) y por ello el movimiento puede
permanecer durante mas tiempo.
Debido a que el tiempo de subida qtr depende inversamente de la frecuencia
natural no amortiguada n = K m , entonces un resorte mas rgido (con
una K mayor) o una masa mas pequena producen respuestas mas rapi-
das (tr menores). Por otro lado, el hechoq que la frecuencia de oscilacion
p
este dada por d = n 1 con n = K
2
m es el principio mediante el
cual se ajusta la cadencia o ritmo de un reloj mecanico mediante el uso de
un sistema masa-resorte-amortiguador oscilatorio: si el reloj se atrasa
hay que aumentar su frecuencia de oscilacion (ritmo o cadencia), lo cual
se consigue tensando mas el resorte para aumentar K. Se hace lo contrario
si el reloj se adelanta.
El caso cuando 1 < < 0 no es posible en este ejemplo porque todas las
constantes b, m y K son positivas. Sin embargo, la situacion en la que 1 <
< 0 ocurre con frecuencia en sistemas de control realimentados, debido a la
interconexion de diversos componentes.

K
m f
b

Figura 3.12. Sistema masa-resorte-amortiguador.


3.4 Races reales diferentes 125

3.4. Races reales diferentes


Considere la siguiente ecuacion diferencial ordinaria, lineal, con coeficientes
constantes de orden n:

y (n) + an1 y (n1) + + a1 y + a0 y = ku (3.66)


dj y
donde los coeficientes ai , i = 0, . . . , n 1, son constantes reales e y (j) = dtj .
Aplicando la transformada de Laplace (3.1) a (3.66) se obtiene:

sn Y (s) + an1 sn1 Y (s) + + a1 sY (s) + a0 Y (s) + P (s) = kU (s)

donde P (s) es un polinomio de s cuyos coeficientes dependen de las condiciones


iniciales y(0), y(0),...,y (n1) (0) y de los coeficientes de la ecuacion diferencial.
Entonces puede escribirse:

k P (s)
Y (s) = U (s) n
sn + an1 sn1 + + a1 s + a0 s + an1 sn1 + + a1 s + a0

Suponga que u(t) = A es una constante, es decir U (s) = A/s. Entonces:

k A P (s)
Y (s) =
N (s) s N (s)
N (s) = sn + an1 sn1 + + a1 s + a0

Suponga por lo pronto que todas las condiciones iniciales son cero. Esto sig-
nifica que P (s) = 0 y se puede escribir:

k A
Y (s) =
N (s) s

Suponga que N (s) solo tiene races reales, distintas entre s y, ademas, distintas
de s = 0, es decir:

N (s) = (s p1 )(s p2 ) (s pn )

donde pi 6= 0, i = 1, . . . , n, con pj 6= pi si i 6= j, representan las races de


N (s). De acuerdo al metodo de expansion en fracciones parciales [2], cap. 4,
[3], cap. 7, en este caso se debe escribir:

k A c1 c2 cn f
Y (s) = = + + + + (3.67)
N (s) s s p1 s p2 s pn s

donde ci , i = 1, . . . , n, y f representan constantes reales que deben ser calcula-


das. Una manera de calcular ci es la siguiente. Multiplquense ambos miembros
de (3.67) por el factor (s pi ) y evaluese toda la expresion en s = pi para
obtener:
126 3 Base matematica: ecuaciones diferenciales

k A
ci = (s pi ) , i = 1, . . . , n
N (s) s s=pi

De manera similar se puede calcular:



kA
f=
N (s) s=0
Usando la transformacion inversa de Laplace, [4], cap.32:
( )
k
L 1
= keat
sa
se obtiene finalmente:
y(t) = c1 ep1 t + c2 ep2 t + + cn epn t + f
que representa la solucion buscada. Notese que se puede escribir:
y(t) = yn (t) + yf (t)
yn (t) = c1 ep1 t + c2 ep2 t + + cn epn t (3.68)
yf (t) = f
donde la respuesta natural yn (t) solo depende de las races del polinomio
caracterstico N (s) mientras que la respuesta forzada yf (t) solo depende de
la fraccion 1s introducida por U (s). Considerense las siguientes posibilidades.
1. Si todas las races del polinomio caracterstico N (s) son negativas, es
decir si pi < 0 para toda i = 1, . . . , n, entonces lmt yn (t) = 0 y
lmt y(t) = yf (t).
2. Si al menos una raz del polinomio caracterstico N (s) es positiva, es decir
si pi > 0 para alguna i, entonces, yn (t) y y(t) , conforme
t .
Por ultimo, si las condiciones iniciales no son cero, entonces la solucion tiene
la forma:
y(t) = c1 ep1 t + c2 ep2 t + + cn epn t + f + q(t)
donde:

P (s)
q(t) = L1 (3.69)
N (s)
La transformacion inversa de Laplace que define a q(t) puede ser obtenida
usando un procedimiento similar al que se acaba de mostrar. Mas aun, el
lector puede darse cuenta de que q(t) esta dada por una funcion de la forma
presentada para yn (t) en (3.68) y que sus coeficientes dependen de las condi-
ciones iniciales y(0) . . . , y (n1) (0). Esto significa que si yn (t) en (3.68)
entonces q(t) tambien y si yn (t) 0 en (3.68) entonces q(t) 0 tam-
bien. De hecho, q(t) forma parte de la respuesta natural cuando las condiciones
iniciales no son cero.
3.4 Races reales diferentes 127

Ejemplo 3.7 Considere la siguiente ecuacion diferencial de segundo orden


dada en (3.40):

y + 2n y + n2 y = kn2 u, y(0) = y0 , y(0) = y0 (3.70)

Si > 1 entonces las dos races, p1 y p2 , del polinomio caracterstico N (s) =


s2 + 2n s + n2 son reales y diferentes:
p
p1 = n + n 2 1
p
p2 = n n 2 1
p1 6= p2

Ademas, ambas races son negativas:

p1 < 0, p2 < 0

Aunque esto es obviop para p2 , para p1 se requiere un


p poco de observacion:
p note-
se que n + n p 2 = 0, y como + 2 2
n n > n + n 1,
entonces n + n 2 1 < 0. En la figura 3.13 se muestra la solucion
y(t) de la ecuacion diferencial en (3.70) cuando > 1, u = A y las condicio-
nes iniciales son cero. Notese que y(t) no presenta oscilaciones en este caso.
Recuerdese que cuando 1 < < 1 la frecuencia de oscilacion es igual a la
parte imaginaria de ambas races. Por tanto, cuando > 1 no hay oscilacion
porque al ser cero la parte imaginaria de ambas races, la frecuencia de las
oscilaciones tambien es cero.

Ejemplo 3.8 Considerese de nuevo el sistema masa-resorte-amortiguador


del ejemplo 3.6. Recuerdese que (3.64) describe el movimiento del carrito.
Suponga que:
b
= >1
2 mK
Entonces, de acuerdo al ejemplo anterior, las races, p1 y p2 , del polinomio
caracterstico s2 + 2n s + n2 son reales, distintas y negativas. Notese que
este caso se presenta cuando el coeficiente de friccion viscosa b > 0 es muy
grande o bien cuando la constante de rigidez del resorte K > 0 o la masa
m del carritop son muy pequenas. Notese tambien que una de las races (p1 =
n + n 2 1 < 0) se aproxima al origen conforme > 1 se hace mas
grande. De acuerdo a lo expuesto en la presente seccion, esto significa que
el movimiento del carrito es cada vez mas lento conforme crece porque la
funcion ep1 t tarda mas tiempo en desaparecer (a
p pesar de que la funcion e
p2 t
2
desaparece mas rapido porque p2 = n n 1 < 0 se aleja cada vez
mas del origen). Esto explica porque en la figura 3.13 se obtienen respuestas
cada vez mas lentas conforme > 1 es mas grande.
128 3 Base matematica: ecuaciones diferenciales

y(t)
0<<1

kA
=1

>1

tiempo
(a) Respuesta en el tiempo
Im (s)


p2 ! n p1 Re (s)

(b) Ubicacion de los polos cuando > 1

Figura 3.13. Solucion de una ecuacion diferencial de segundo orden en (3.70),


cuando > 1, y en (3.75), cuando = 1, con u = A y las condiciones iniciales son
cero.

Ejemplo 3.9 Considere la siguiente ecuacion:

y + cy + dy = eu, y(0) = y0 , y(0) = y0

con c, d y e constantes reales. Las dos races, p1 y p2 , del polinomio carac-


terstico N (s) = s2 + cs + d estan dadas como:

c c2 4d
p1 = +
2 2
c c2 4d
p2 =
2 2
3.5 Races reales repetidas 129

Se tienen los siguientes casos:


Si d < 0 entonces:
p
c c2 + 4 abs(d)
p1 = +
2 p 2
c 2
c + 4 abs(d)
p2 =
2 2
las dos races son reales y diferentes siendo una positiva y otra negativa,
sin importar el valor de c. En el ejemplo 7.3 del captulo 7 se muestra que
este caso corresponde al de un sistema masa-resorte-amortiguador con co-
eficiente de rigidez negativo y que esto se obtiene en la practica cuando un
pendulo simple funciona alrededor de su configuracion invertida (tambien
llamada inestable).
Si c > 0 y d > 0 se recupera el caso estudiado en la seccion 3.3 cuando
1 > > 0 y en la presente seccion cuando > 1.
Si c < 0 y d > 0, con abs(c) pequeno y d grande, se recupera el caso
estudiado en la seccion 3.3 cuando 1 < < 0. La situacion cuando
< 1 tambien se obtiene en este caso cuando abs(c) es grande y d es
pequeno, pero las dos races son positivas y diferentes:
p
p1 = n + n 2 1 > 0
p
p2 = n n 2 1 > 0
p1 6= p2

Los casos = 1 y = 1 se estudian en la siguiente seccion.

3.5. Races reales repetidas


Considere la siguiente ecuacion diferencial ordinaria, lineal, con coeficientes
constantes de orden n:

y (n) + an1 y (n1) + + a1 y + a0 y = ku (3.71)

donde u(t) = A es una constante, es decir U (s) = A/s. Procediendo como en


la seccion 3.4 se obtiene:
k A P (s)
Y (s) =
N (s) s N (s)
N (s) = sn + an1 sn1 + + a1 s + a0

Suponga por lo pronto que todas las condiciones iniciales son cero, es decir
P (s) = 0, entonces:
k A
Y (s) =
N (s) s
130 3 Base matematica: ecuaciones diferenciales

Suponga que N (s) solo tiene una raz la cual esta repetida n veces y que es
diferente de cero, es decir:

N (s) = (s p)n

con p 6= 0. De acuerdo al metodo de expansion en fracciones parciales [2], cap.


4, [3], cap. 7, en este caso se debe escribir:

k A cn cn1 cn2 c2 c1 f
= + + + + + +
N (s) s (s p)n (s p)n1 (s p)n2 (s p)2 sp s
(3.72)

donde ci , i = 1, . . . , n, y f representan constantes reales que deben ser calcu-


ladas. Una manera de calcular cn es multiplicando ambos miembros de (3.72)
por el factor (s p)n y evaluando en s = p para obtener:

kA
cn =
p
Por otro lado, las constantes ci , i = 1, . . . , n 1, se pueden calcular multipli-
cando ambos miembros de (3.72) por el factor (s p)n , derivando n i veces
respecto a s y evaluando en s = p para obtener:

dni kA
ci = , i = 1, . . . , n 1
dsni s s=p

Finalmente, la constante f se puede calcular multiplicando ambos miembros


de (3.72) por el factor s y evaluando en s = 0 para obtener:

kA
f=
N (s) s=0

Entonces, se puede escribir:


cn cn1 cn2 c2 c1 f
Y (s) = + + + + + +
(s p)n (s p)n1 (s p)n2 (s p)2 sp s

Usando la transformacion inversa de Laplace [4], cap. 32:


( )
1 tj1
L 1
j
= eat , j = 1, 2, 3, . . . , 0! = 1
(s a) (j 1)!

se obtiene finalmente:
tn1 tn2 tn3
y(t) = cn ept + cn1 ept + cn2 ept +
(n 1)! (n 2)! (n 3)!
+ c2 t ept + c1 ept + f
3.5 Races reales repetidas 131

que representa la solucion buscada. Notese que se puede escribir:


y(t) = yn (t) + yf (t)
tn1 tn2 tn3
yn (t) = cn ept + cn1 ept + cn2 ept +
(n 1)! (n 2)! (n 3)!
+c2 t ept + c1 ept (3.73)
yf (t) = f
Observese de nuevo que yn (t) solo depende de las races del polinomio ca-
racterstico N (s) y que yf (t) solo depende de la fraccion 1s introducida por
U (s). Finalmente, si las condiciones iniciales son diferentes de cero entonces
la solucion esta dada como:
tn1 tn2 tn3
y(t) = cn ept + cn1 ept + cn2 ept +
(n 1)! (n 2)! (n 3)!
+ c2 t ept + c1 ept + f + q(t)

P (s)
q(t) = L1
N (s)
donde q(t) es una funcion del tiempo cuya forma es identica a la de yn (t)
en (3.73) y cuyos coeficientes dependen de las condiciones iniciales. De hecho,
q(t) forma parte de la respuesta natural en el caso en que las condiciones
iniciales son diferentes de cero.
Considerense las siguientes posibilidades:
1. Si p < 0 es de utilidad calcular el siguiente lmite, donde j es cualquier
numero entero positivo:
tj
lm tj ept = lm
t t ept
lo cual da una indeterminacion porque pt +. Entonces puede usarse
la regla de LHopital [13], pag. 303:
dtj
tj j tj1
lm tj ept = lm = lm dt
= lm
t ept t de t p ept
pt
t
dt

Como se sigue obteniendo una indeterminacion se puede aplicar LHopital


de nuevo varias veces hasta obtener:
dtj
tj j tj1
lm tj ept = lm = lm dt
= lm
t ept t de t p ept
pt
t
dt
j2
j(j 1) t j!
= lm 2
= = lm =0
t (p) e pt t (p)j ept
Aplicando esto a la solucion obtenida se concluye que lmt yn (t) = 0,
lmt y(t) = yf (t) para cualquier valor p < 0 sin importar que tan
cercano a cero este dicho valor.
132 3 Base matematica: ecuaciones diferenciales

2. Si p > 0 es claro que yn (t) y y(t) conforme t .


3. Por ultimo, para considerar el caso en el que el polinomio caracterstico
tiene n races repetidas en p = 0 suponga que U (s) = 0. Por tanto:
P (s)
Y (s) = , N (s) = sn
N (s)
Entonces, de acuerdo al metodo de expansion en fracciones parciales [2],
cap 4, [3], cap. 7, en este caso se debe escribir:
P (s) cn cn1 cn2 c2 c1
n
= n + n1 + n2 + + 2 +
s s s s s s
Usando la transformada de Laplace [4], cap.32:
( )
1 1 tj1
L = , j = 1, 2, 3, . . . , 0! = 1
sj (j 1)!
se obtiene:
tn1 tn2 tn3
y(t) = yn (t) = cn + cn1 + cn2 +
(n 1)! (n 2)! (n 3)!
+c2 t + c1 (3.74)
yf (t) = 0
Es claro que yn (t) y y(t) cuando t para n 2 y que
yn (t) es una constante si n = 1. Notese que en el caso en que U (s) = A/s,
yn (t) contendra, ademas de los terminos en (3.74), el termino tn mientras
que yf (t) estara dada como:
Z t Z t
kA n
yf (t) = A dtn . . . dt1 = t
| {z } n!
| 0 {z 0} n dif erenciales
n integrales

Ejemplo 3.10 Considere la siguiente ecuacion diferencial de segundo orden


dada en (3.40):
y + 2n y + n2 y = kn2 u, y(0) = y0 , y(0) = y0 (3.75)
Si = 1 entonces las dos races, p1 y p2 , del polinomio caracterstico N (s) =
s2 + 2n s + n2 son reales, negativas e iguales:
p1 = p2 = n
En la figura 3.13 se muestra la solucion y(t) de la ecuacion diferencial en
(3.75) cuando = 1, u = A y las condiciones iniciales son cero. Notese que
y(t) no presenta oscilaciones en este caso porque ambas races tienen parte
imaginaria igual a cero. Este caso, = 1, representa la frontera entre una
solucion oscilatoria < 1 y una solucion que no oscila > 1. De hecho el
caso = 1 produce la respuesta mas rapida sin que haya oscilaciones ya que
cuando > 1 la respuesta es cada vez mas lenta conforme crece.
3.5 Races reales repetidas 133

Ejemplo 3.11 Considerese de nuevo el sistema masa-resorte-amortiguador


del ejemplo 3.6. Recuerdese que (3.64) describe el movimiento del carrito.
Suponga que:
b
= =1
2 mK
Entonces, en este caso el polinomio caracterstico s2 + 2n s + n2 solo tiene
una raz real y negativa:

p = n

la cual esta repetida dos veces. La posicion x(t) del carrito evoluciona exac-
tamente de la misma forma en que lo hace y(t) en la figura 3.13. Este tipo
de respuesta puede ser de mucha utilidad si se desea que el movimiento del
carrito sea rapido y sin oscilaciones.
Ejemplo 3.12 Suponga que en la figura 3.12 no existe ningun resorte ni
amortiguador, es decir, suponiendo que b = 0 y K = 0 la ecuacion (3.63) se
reduce a:

mx = f (3.76)

Notese que el polinomio caracterstico es en este caso s2 el cual tiene una


raz real p = 0 repetida dos veces. Ahora suponga que todas las condiciones
iniciales son cero y que el carrito recibe una pequena perturbacion descrita
por:

0 , 0 t t 1
f= (3.77)
0, en otro caso

donde 0 > 0 y t1 > 0 son numeros constantes pequenos. Integrando (3.76)


una vez se obtiene:
Z
1 t
x(t) = f ( )d + x(0)
m 0

Integrando de nuevo se tiene (suponiendo que x(0) = 0):


Z Z r
1 t
x(t) = f ( )d dr + x(0)
m 0 0
Z Z r
1 t
x(t) = f ( )d dr, x(0) = 0
m 0 0

Sustituyendo (3.77) se obtiene:


1 2
x(t) = 2m 0 t , 0 t t1
1 2 1

2m 0 1t + t
m 0 1 (t t 1 ), t > t1
134 3 Base matematica: ecuaciones diferenciales

Notese que x(t) conforme t (vease la figura 3.14) a pesar de que


f = 0 para t > t1 , es decir, a pesar de que la respuesta forzada es cero para
todo t > t1 . Esto significa que la respuesta natural xn (t) cuando t ,
lo cual confirma los resultados obtenidos en la presente seccion para races
reales iguales a cero que estan repetidas dos veces o mas. El lector puede
recurrir a su experiencia para verificar que un pequeno golpe (f en (3.77))
sobre el carrito es suficiente para que este empiece a moverse para nunca
detenerse (x(t) ) si no existe friccion entre el carrito y el piso.

x(t)

"0
m t1

"0 2
2m
t

t1 t [s]

Figura 3.14. Posicion del carrito de la figura 3.12 cuando es perturbado y no existe
ningun resorte ni amortiguador.

Ejemplo 3.13 Considere la siguiente ecuacion diferencial de segundo orden


dada en (3.40):

y + 2n y + n2 y = kn2 u, y(0) = y0 , y(0) = y0

Si = 1 entonces las dos races, p1 y p2 , del polinomio caracterstico N (s) =


s2 + 2n s + n2 son reales, positivas e iguales:

p1 = p2 = n > 0

3.6. Races complejas conjugadas diferentes


Considere la siguiente ecuacion diferencial ordinaria, lineal, con coeficientes
constantes de orden n:

y (n) + an1 y (n1) + + a1 y + a0 y = ku (3.78)

donde u(t) = A es una constante, es decir U (s) = A/s. Procediendo como en


la seccion 3.4 se obtiene:
3.6 Races complejas conjugadas diferentes 135

k A P (s)
Y (s) =
N (s) s N (s)
N (s) = sn + an1 sn1 + + a1 s + a0

Suponga por lo pronto que todas las condiciones iniciales son cero, es decir
P (s) = 0, entonces:

k A
Y (s) =
N (s) s

Suponga que N (s) tiene n/2 races complejas conjugadas diferentes, es decir:
i=n/2
Y
N (s) = [(s i )2 + di
2
]
i=1

donde i 6= j o di 6= dj si i 6= j. Entonces, de acuerdo al metodo de


expansion en fracciones parciales [2], cap. 4, [3], cap. 7, en este caso se debe
escribir:
i=n/2
k A X Fi s + Ci f
= 2 + 2 ]
+
N (s) s i=1
[(s i ) di s

donde f es una constante que se puede calcular como en las secciones previas,
es decir:

kA
f=
N (s) s=0

mientras que Fi y Ci son constantes que pueden calcularse del mismo modo
en que se calculan B y C en la seccion 3.3. Por tanto, usando (3.47) se puede
escribir:

y(t) = yn (t) + yf (t) (3.79)


i=n/2
X
yn (t) = i ei ni t sin (di t + i )
i=1
yf (t) = f

donde i , ni , i y i , i = 1, . . . , n/2, son constantes reales (vease la seccion


3.3). El comportamiento de la solucion en (3.79) satisface uno de los siguientes
casos.
1. Si 0 < i < 1 para toda i = 1, . . . , n/2, es decir si la parte real de to-
das las races del polinomio caracterstico N (s) es estrictamente negativa,
i ni < 0 para toda i = 1, . . . , n/2, entonces y(t) oscila de manera que
lmt yn (t) = 0 y lmt y(t) = yf (t).
136 3 Base matematica: ecuaciones diferenciales

2. Si 1 < i < 0 para alguna i = 1, . . . , n/2, es decir si la parte real de


alguna de las races del polinomio caracterstico N (s) es estrictamente
positiva, i ni > 0 para alguna i = 1, . . . , n/2, entonces y(t) oscila de
manera que yn (t) y y(t) crecen sin lmite conforme el tiempo aumenta.
3. Si i = 0 para toda i = 1, . . . , n/2, es decir si la parte real de todas las
races del polinomio caracterstico N (s) es cero, i ni = 0 para toda
i = 1, . . . , n/2, entonces yn (t) no desaparece al crecer el tiempo pero
tampoco crece sin lmite. Por tanto, aunque y(t) no crece sin lmite, sin
embargo no converge a yf (t). Notese que para que esta situacion ocurra
es suficiente que i = 0 para al menos una i y que para todas las demas i
se cumpla 0 < i < 1.
Finalmente, si las condiciones iniciales son diferentes de cero, entonces:

y(t) = yn (t) + yf (t) + q(t)


i=n/2
X
yn (t) = i ei ni t sin (di t + i )
i=1
yf (t) = f

donde:

1 P (s)
q(t) = L
N (s)

Es sencillo verificar que q(t) esta dado por funciones de la misma forma que
las funciones que componen a yn (t). De hecho q(t) forma parte de la respuesta
natural cuando las condiciones iniciales son diferentes de cero.
Es importante senalar que si 1 o 1 entonces se obtienen races
reales y se recupera uno de los casos de las secciones 3.4 o 3.5.
Es conveniente aclarar que se asume que las races complejas siempre apa-
recen con sus parejas conjugadas debido a que esa es la unica manera en
que el producto (s a)(s a), con a un numero complejo y a su conjugado,
resulte en un polinomio cuyos coeficientes son todos numeros reales. Enton-
ces, cualquier polinomio que contenga races complejas y tambien sus parejas
conjugadas solo tendra coeficientes reales. Este es un aspecto importante en
ingeniera de control donde las ecuaciones diferenciales representan sistemas
fsicos que, por tanto, solo manejan variables y parametros reales. Por ejemplo,
el polinomio caracterstico del sistema masa-resorte-amortiguador presentado
b
en (3.64) esta dado como s2 + m s+ Km donde los coeficientes representan la
masa, el coeficiente de friccion viscosa y la constante de rigidez del resorte.
Es claro que ninguno de estos parametros pueden tener parte imaginaria pues
representan propiedades cuyos efectos pueden ser apreciados experimental-
mente.
Ejemplo 3.14 En el ejemplo 2.5 del captulo 2 se ha obtenido el modelo
matematico del sistema compuesto por dos cuerpos y tres resortes mostrado
3.6 Races complejas conjugadas diferentes 137

en la figura 3.15. A partir de ese resultado se puede abordar el caso en el que


el resorte de la izquierda no esta presente. Esto se consigue considerando que
K1 = 0, es decir:
b K2 1
x1 + (x1 x2 ) + (x1 x2 ) = F (t)
m1 m1 m1
b K3 K2
x2 (x1 x2 ) + x2 (x1 x2 ) = 0
m2 m2 m2

F(t) x1 K2 x2
K1 K3
m1 m2

Figura 3.15. Sistema con dos cuerpos y tres resortes.

Aplicando la transformada de Laplace (3.1) a cada una de estas ecuaciones


diferenciales y considerando todas las condiciones iniciales iguales a cero se
obtiene:

1 b K2
m1 F (s) + m1 s + m1 X2 (s)
X1 (s) = K2
s2 + mb1 s + m 1

b K2
m2 s + m2 X1 (s)
X2 (s) = 2
s + mb2 s + K2m+K 2
3

Sustituyendo la segunda ecuacion en la primera y despues de realizar algunas


manipulaciones algebraicas se obtiene:

1 2 b K2 +K3
m1 s + m2 s + m2 F (s)
X1 (s) =
K2 2 + b s + K2 +K3 K2 K2
s2 + mb1 s + m 1
s m2 m2
b
m1 s + m1
b
m2 s + m2

Con el fn de simplificar el algebra correspondiente, supongamos que b = 0,


entonces:

1 2 K2 +K3
m1 s + m2
X1 (s) = 2
F (s)
s2 + m K2
s2 + K2 +K3 K2
1 m2 m1 m2

o, equivalentemente:
138 3 Base matematica: ecuaciones diferenciales

1 K2 +K3
m1 s2 + m2
X1 (s) = F (s) (3.80)
K2 K2 +K3 K2 K3
s4 + m1 + m2 s2 + m1 m2

Por otro lado, notese que si se multiplican dos polinomios de segundo orden
con coeficientes reales a, d, c, e, se obtiene:

(s2 + as + c)(s2 + ds + e) = s4 + (a + d)s3 + (c + ad + e)s2 + (cd + ea)s + ce

Esto significa que la siguiente simplificacion:

(s2 + as + c)(s2 + ds + e) = s4 + (c + ad + e)s2 + ce (3.81)

es posible si y solo si:

a+d=0 y cd + ea = 0 (3.82)

La primera condicion implica que a = d lo cual, sustituido en la segunda


condicion, implica que d(c e) = 0. Por tanto, la igualdad en (3.81) es posible
si y solo si ocurre una de las siguientes posibilidades: i) d = a = 0, ii)
c = e 6= 0, a = d, o bien, iii) d = a = e = c = 0. La razon de estudiar la
igualdad en (3.81) es el poder determinar como se puede descomponer en dos
factores el polinomio en el denominador de (3.80). En este sentido, notese
que la situacion en iii) no es de interes porque en tal caso solo aparecera el
termino de s4 en el lado derecho de (3.81). Por otro lado, cuando es aplicado
al polinomio en el denominador de (3.80), el caso en ii) implica que:

K2 K2 + K3
2e a2 = +
m m2
r1
K2 K3
e=
m1 m2
Combinando ambas expresiones se obtiene:
r
2 K2 K3 K2 K3 K2
a =2 + <0 (3.83)
m1 m2 m1 m2 m2

La razon para la desigualdad al final de esta expresion es que, por definicion,


el siguiente binomio al cuadrado siempre es positivo o cero:
r r !2 r
K2 K3 K2 K3 K2 K3
= + 2 0
m1 m2 m1 m2 m1 m 2

Por tanto, de acuerdo a (3.83), el valor de a sera un numero imaginario.


Este caso debe desecharse porque viola la hipotesis inicial de que todos los
coeficientes a, d, c, e, deben ser reales (vease tambien el parrafo previo a este
3.6 Races complejas conjugadas diferentes 139

ejemplo). Entonces, el unico caso posible es i) d = a = 0, el cual, cuando es


aplicado al polinomio en el denominador de (3.80), implica:
K2 K2 + K3
c+e = + (3.84)
m1 m2
K2 K3
ce = (3.85)
m1 m2
K2
Definiendo f = m 1
+ K2m+K2
3
yg= m K2 K3
1 m2
se tiene, de la segunda expresion,
c = g/e y, sustituyendo en la primera expresion, g/e + e = f . Finalmente,
multiplicando este resultado por e se obtiene:

e2 ef + g = 0

Es interesante observar que, siguiendo el mismo procedimiento, se encuentra


que la misma ecuacion es valida para c:

c2 cf + g = 0

Resolviendo estas ecuaciones cuadraticas se encuentran las siguientes dos so-


luciones:
r 2
K2 K2 +K3 K2 K2 +K3 4K 2
m1 + m2 + m1 m2 + m1 m2 2
e1 = c1 =
r 2 2
K2 K2 +K3 K2 K2 +K3 4K22
m1 + m2 m1 m2 + m1 m2
e2 = c2 =
2
Notese que el caso e = c no es posible porque entonces (3.84) y (3.85) impli-
caran que:
r
K2 K2 + K3 K2 K3
+ =2
m1 m2 m1 m 2
lo cual conducira a:
r r !2
K2 K3 K2
=
m1 m2 m2

que no es posible porque el miembro izquierdo de esta expresion no puede ser


negativo. De este modo, solo son posibles los casos: a) e = e1 y c = c2 o, b)
e = e2 y c = c1 , los cuales son equivalentes porque, debido a que d = a = 0,
(3.80) se puede escribir como:

1 2 K2 +K3
m1 s + m2
X1 (s) = F (s) (3.86)
(s2 + c)(s2 + e)
140 3 Base matematica: ecuaciones diferenciales
r 2
K2 K2 +K3 K2 K2 +K3 K2
Por otro lado, es claro que m1 + m2 + m1 m2 = 2m 1
, lo
K2
cual asegura que e1 = c1 > 0. Observese, sin embargo, que aunque m +
r 2
1

K2 +K3 K2 K2 +K3
m2 m1 m2 = 2 K2m+K
2
3
> 0 esto no asegura que e2 = c2 > 0
4K 2
por el termino adicional m1 m2 2 dentro del radical. Este problema se resuelve
recurriendo a (3.85): los valores de e y c deben tener el mismo signo porque
el miembro derecho de (3.85) es positivo. Entonces, ambos e y c deben ser
positivos porque de acuerdo a los unicos casos posibles a) y b) se debe usar
e = e1 > 0 (lo cual fuerza que c = c2 > 0) o c = c1 > 0 (lo cual fuerza
que e = e2 > 0). Finalmente, el razonamiento al principio de este parrafo
tambien muestra que, a excepcion de algunos posibles valores muy especiales
para m1 , m2 , K2 , K3 , ambos e1 = c1 y e2 = c2 , son diferentes de K2m+K
2
3
. Esto
asegura que no existen cancelaciones entre los polinomios del numerador y
del denominador en (3.86) y el hecho de que e y c sean positivos y diferentes
asegura que el polinomio caracterstico de (3.86) tiene dos pares de races
complejas (imaginarias puras) conjugadas diferentes.

3.7. Races complejas conjugadas repetidas


Considere la siguiente ecuacion diferencial ordinaria, lineal, con coeficientes
constantes de orden n:

y (n) + an1 y (n1) + + a1 y + a0 y = ku (3.87)

donde u(t) = A es una constante, es decir U (s) = A/s. Procediendo como en


la seccion 3.4 se obtiene:
k A P (s)
Y (s) =
N (s) s N (s)
N (s) = sn + an1 sn1 + + a1 s + a0

Suponga por lo pronto que todas las condiciones iniciales son cero, es decir
P (s) = 0, entonces:

k A
Y (s) =
N (s) s

Suponga que el polinomio caracterstico N (s) tiene dos races complejas con-
jugadas repetidas n/2 veces (para tener un total de n races):

N (s) = (s2 + 2n s + n2 )n/2 = [(s )2 + d2 ]n/2

Entonces, la expansion en fracciones parciales correspondiente a este caso es


[2], cap. 4:
3.7 Races complejas conjugadas repetidas 141

k A F1 s + C1 F2 s + C2
= 2
+ +
N (s) s 2
[(s ) + d ] n/2 [(s )2 + d2 ]n/21
Fn/21 s + Cn/21 Fn/2 s + Cn/2 f
+ 2 2 2
+ 2 2 +
[(s ) + d ] (s ) + d s
En el caso de races reales se encontro que cuando estas son sencillas intro-
ducen terminos de la forma ept donde p es la raz en cuestion. Cuando dicha
raz es repetida j veces, se encontro que los terminos introducidos se transfor-
man en la forma tj1 ept . En el caso de races complejas conjugadas repetidas
ocurre algo similar. En este caso no se hara una demostracion formal de lo
que sigue debido a la complejidad del tema. Solo se presenta la idea intuitiva
de la solucion para comprender el porque de la forma obtenida.
Usando la transformacion inversa obtenida en (3.47) se encontro que una
raz compleja conjugada no repetida (sencilla) introduce en el tiempo un termi-
no de la forma:
( )
Bs + C
L1
= et sin(d t + )
(s )2 + d2

para algunas constantes y . Entonces y(t), formada por el efecto de races


complejas conjugadas repetidas, tiene la forma:
y(t) = yn (t) + yf (t) (3.88)
n/21 t n/22 t
yn (t) = n/2 t e sin(d t + n/2 ) + n/21 t e sin(d t + n/21 )
+ + 2 tet sin(d t + 2 ) + 1 et sin(d t + 1 )
yf (t) = f
La solucion en (3.88) tiene uno de los siguientes comportamientos.
1. Si la raz compleja conjugada tiene parte real positiva = n > 0, es
decir si 1 < < 0, es facil ver que yn (t) y y(t) conforme
t .
2. Si la raz compleja conjugada tiene parte real negativa = n < 0, es
decir si 0 < < 1, se puede proceder como en la seccion 3.5 para calcular
el siguiente lmite:
lm tj et sin(d t + ) = 0
t

para cualquier entero j positivo y cualquier numero real estrictamente


negativo . Entonces, para races complejas conjugadas, repetidas, con
parte real negativa se tiene que lmt yn (t) = 0 y lmt y(t) = yf (t).
3. Si la raz repetida tiene parte real cero, es decir, = 0. Entonces:
y(t) = yn (t) + yf (t)
yn (t) = n/2 tn/21 sin(d t + n/2 ) + n/21 tn/22 sin(d t + n/21 ) +
+2 t sin(d t + 2 ) + 1 sin(d t + 1 )
yf (t) = f
142 3 Base matematica: ecuaciones diferenciales

Notese que en este caso la respuesta natural, yn (t), crece sin lmite confor-
me el tiempo crece en el caso en que la raz se repita al menos dos veces.
Pero si la raz es sencilla entonces yn (t) esta formada por una funcion os-
cilatoria cuya amplitud no crece ni disminuye, es decir, aunque y(t) nunca
alcanzara de manera permanente a yf (t) la solucion y(t) permanece sin
crecer demasiado.
Finalmente, es sencillo verificar que si las condiciones iniciales no son cero
entonces:

y(t) = yn (t) + yf (t) + q(t)


yn (t) = n/2 tn/21 et sin(d t + n/2 ) + n/21 tn/22 et sin(d t + n/21 )
+ + 2 tet sin(d t + 2 ) + 1 et sin(d t + 1 )
yf (t) = f

donde:

1 P (s)
q(t) = L
N (s)

La funcion q(t) esta dada por las mismas funciones que componen a yn (t) y
las tres posibilidades enumeradas previamente tambien siguen vigentes en este
caso. De hecho q(t) forma parte de la respuesta natural cuando las condiciones
iniciales son diferentes de cero.
Ejemplo 3.15 (Tomado de [2], cap. 4)Considere el sistema masa-resorte
mostrado en la figura 3.12. Suponga que no existe ningun amortiguador, es
decir que b =q0, y que se aplica una fuerza externa con la forma f = F0 sin(t)
K
donde = m . Se desea describir la posicion del carrito x(t) si x(0) = 0
y x(0) = 0. No es necesario calcular el valor numerico de las constantes que
aparecen en x(t).
Solucion. La ecuacion diferencial que describe la situacion en la figura 3.12
cuando b = 0 es:
r
K
mx + Kx = f, f = F0 sin(t), = (3.89)
m
Aplicando la transformada de Laplace a (3.89):

K 1
s2 X(s) + X(s) = F (s)
m m
Notese que esta expresion tiene la forma:

s2 X(s) + n2 X(s) = n2 F (s)


q
K 1
donde n = m = , = K. Se sabe que:
3.7 Races complejas conjugadas repetidas 143

F0
F (s) =
s2 + 2
Entonces:
3 F0
X(s) =
(s2 + 2 )2
Expandiendo en fracciones parciales:
As + B Cs + D
X(s) = + 2
(s2 + 2 )2 s + 2
Por tanto, de acuerdo a lo expuesto en la presente seccion, se puede escribir:
x(t) = 1 t sin(t + 1 ) + 2 sin(t + 2 )
Donde 1 , 2 , 1 , 2 son algunas constantes
q reales. En la figura 3.16 se mues-
tra una grafica de x(t) cuando = K m = 10[rad/s], m = 1[Kg] y F0 = 1[N].
A este fenomeno se le conoce como resonancia y significa que aunque la
entrada es acotada la salida puede alcanzar valores muy grandes a pesar de
que el polinomio caracterstico no tiene races con parte real positiva ni repe-
tidas en s = 0, por lo que este es un fenomeno diferente al que se presenta en
el ejemplo 3.12. Notese que el problema de la resonancia aparece cuando un
sistema (ecuacion diferencial) esta mal amortiguado ( 0) y se excita con
una senal oscilatoria cuya frecuencia es igual (o muy cercana) a la frecuencia
natural del sistema. Debido a que la posicion del carrito crece sin lmite la
resonancia es un fenomeno que se considera peligroso.

x [m]
0,8

0,6

0,4

0,2

-0,2

-0,4

-0,6

-0,8

0 2 4 6 8 10 12 14 16 18 20
t [s]

Figura 3.16. Posicion de un sistema masa-resorte sometido a condiciones de reso-


nancia.
144 3 Base matematica: ecuaciones diferenciales

3.8. Una ecuacion diferencial general


Una ecuacion diferencial ordinaria, lineal, con coeficientes constantes de
orden n siempre puede escribirse como:
y (n) + an1 y (n1) + + a1 y + a0 y = b0 u + b1 u + + bm u(m) (3.90)
donde n m. Si n < m la ecuacion diferencial no tiene sentido fsico, es
decir, en la practica no existe ningun dispositivo real que este representado
por dicha ecuacion diferencial y, por tanto, no es de interes para los ingenie-
ros. Notese que todas las derivadas que aparecen son con respecto al tiempo.
Esta caracterstica permite llamar a estas ecuaciones diferenciales sistemas
dinamicos. La funcion y es la incognita de la ecuacion mientras que u es una
funcion del tiempo conocida que tambien es llamada excitacion. El objetivo
de resolver la ecuacion diferencial es encontrar la funcion y(t) que satisfaga la
igualdad definida por la ecuacion diferencial. Para encontrar y(t) es necesario
conocer u(t), las constantes reales ai , i = 0, . . . , n 1, bj , j = 0, . . . , m, y el
conjunto de n constantes y(0), y(0) ... y (n1) (0), conocidas como condiciones
iniciales del problema, que representan los valores que la funcion incognita y
sus derivadas tienen en t = 0.
Aplicando la transformada de Laplace (3.1) a (3.90):
sn Y (s) + an1 sn1 Y (s) + + a1 sY (s) + a0 Y (s) + P (s)
= b0 U (s) + b1 sU (s) + + bm sm U (s)
donde P (s) es un polinomio de s cuyos coeficientes dependen de las condiciones
iniciales y(0), y(0),...,y (n1) (0), u(0), u(0),...,u(m1) (0) y los coeficientes de la
ecuacion diferencial. Entonces se puede escribir:
b0 + b1 s + + bm sm P (s)
Y (s) = U (s) n
sn + an1 sn1 + + a1 s + a0 s + an1 sn1 + + a1 s + a0
Suponga que u(t) = A es una constante, es decir U (s) = A/s. Entonces:
B(s) A P (s)
Y (s) =
N (s) s N (s)
N (s) = sn + an1 sn1 + + a1 s + a0
B(s) = b0 + b1 s + + bm sm
Suponga por lo pronto que todas las condiciones iniciales son cero. Esto sig-
nifica que P (s) = 0 y se puede escribir:
B(s) A
Y (s) =
N (s) s
De acuerdo al metodo de expansion en fracciones parciales [2], cap. 4, [3], cap.
7, la solucion en el tiempo y(t) depende de las races del polinomio carac-
terstico N (s), es decir, de los polos de la siguiente funcion de transferencia:
3.8 Una ecuacion diferencial general 145

Y (s) B(s)
= G(s) = (3.91)
U (s) N (s)

y del factor 1s introducido por U (s) = A/s. La variable y(t) se conoce como
la salida y u(t) como la entrada de la funcion de transferencia G(s). El orden
de G(s) se define como el grado del polinomio caracterstico N (s). Como un
polinomio de grado n tiene n races, entonces una funcion de transferencia de
orden n tiene n polos (vease el parrafo que sigue a (3.21)). Por otro lado, las
races del polinomio B(s) se conocen como los ceros de la funcion de transfe-
rencia G(s). Si B(s) es de grado m entonces G(s) tiene m ceros. Recuerdese
la condicion n m impuesta al principio de esta seccion. En las secciones
previas se ha visto que siempre se puede escribir y(t) = yn (t) + yf (t) y que
el efecto de las condiciones iniciales siempre se pueden considerar como parte
de yn (t). Tambien se ha visto que yn (t) depende de la naturaleza de las races
del polinomio caracterstico N (s), es decir, si son reales, sencillas o repetidas,
si son complejas conjugadas, sencillas o repetidas y si tienen parte real nega-
tiva, positiva o cero. Si yn (t) tiende a cero conforme el tiempo crece se dice
que la ecuacion diferencial en (3.90) o, equivalentemente, que la funcion de
transferencia G(s) es estable. Resumiendo todos los casos estudiados en las
secciones anteriores ahora se puede afirmar lo siguiente:

Condiciones para la estabilidad de una funcion de transferencia


1. Si todos los polos de G(s) tienen parte real estrictamente negativa entonces
G(s) es estable.
2. Si todos los polos de G(s) tienen parte real estrictamente negativa a ex-
cepcion de algunos polos sencillos (no repetidos) que tienen parte real cero
entonces la funcion de transferencia G(s) es marginalmente estable. Esto
significa que aunque yn (t) no desaparece al crecer el tiempo sin embargo
tampoco crece sin lmite.
3. Si al menos un polo de G(s) tiene parte real estrictamente positiva en-
tonces la funcion de transferencia G(s) es inestable, es decir, yn (t) crece
hasta el infinito conforme el tiempo crece.
4. Si existe al menos un polo de G(s) con parte real cero que esta repetido
al menos dos veces entonces G(s) es inestable.
Por otro lado, tambien se ha visto que yf (t) depende de la entrada u(t) y
que, de hecho, ambas tienen la misma forma si el polinomio caracterstico
no tiene races en s = 0 (si G(s) no tiene polos en s = 0). Esto significa que
en un sistema de control la variable u(t) puede ser usada como el valor que
se desea que alcance la salida y(t), es decir, u(t) puede ser usada para espe-
cificar el valor deseado de y(t). Esto se consigue de la siguiente manera. Si la
funcion de transferencia es estable (es decir, yn (t) 0) entonces y(t) yf (t)
y, por tanto, solo resta asegurar que yf (t) = u. A continuacion se establecen
las condiciones para cumplir esto en el caso en que u = A es una constante.
146 3 Base matematica: ecuaciones diferenciales

Condiciones que aseguran que lmt y(t) = A.


La respuesta total y(t) alcanza a la salida deseada u = A conforme el tiem-
po crece, es decir yf (t) = A y yn (t) 0, si G(s) es estable y los coeficientes
de los terminos independientes de los polinomios B(s) y N (s) son iguales, es
decir, si B(0) = N (0). Esto se comprueba usando el teorema del valor final
(3.3):
B(s) A B(0)
lm y(t) = lm sY (s) = lm s = A=A (3.92)
t s0 s0 N (s) s N (0)
Bajo estas condiciones se dice que G(s) es una funcion de transferencia de
ganancia unitaria en estado estacionario. Cuando u no es una constante y
se desea que lmt y(t) = u(t), tambien se requiere que G(s) sea estable,
yn (t) 0, pero algunas condiciones adicionales deben ser satisfechas. La
determinacion de estas condiciones y la manera de satisfacerlas es parte de lo
que se estudia en los captulos restantes de esta obra (vease la seccion 4.4).
Ejemplo 3.16 Considere la situacion presentada en el ejemplo 3.12. A partir
de ese ejemplo se puede establecer un experimento que nos permite saber si un
sistema, ecuacion diferencial o funcion de transferencia es estable o inestable:

Si se perturba ligeramente a un sistema que originalmente esta en reposo


puede haber dos comportamientos:
Si el sistema es estable entonces se mueve y despues de cierto tiempo
regresa al reposo en el mismo lugar en que originalmente se encontraba
Si el sistema es inestable entonces se mueve cada vez mas de manera
que se aleja mas y mas del lugar en donde inicialmente estaba.
Ejemplo 3.17 Considere el tanque que contiene agua estudiado en el ejemplo
3.2 y mostrado en la figura 3.3. Suponga que se utiliza una bomba de agua que
produce un flujo qi que es proporcional al voltaje u aplicado en las terminales
de la bomba, es decir:

qi = k1 u (3.93)

donde k1 es una constante positiva. Suponga tambien que el voltaje aplicado


a la bomba se obtiene de acuerdo a la expresion:

u = kp (hd h) (3.94)

donde hd es un valor constante que representa el nivel de agua deseado, h es el


nivel de agua actual en el tanque y kp es una constante positiva. Combinando
estas expresiones junto con el modelo en (3.26) se obtiene:
dh
+ ah = kk1 kp (hd h)
dt
Agrupando terminos:
3.8 Una ecuacion diferencial general 147

dh
+ b1 h = b2 h d (3.95)
dt
b1 = a + kk1 kp > 0, b2 = kk1 kp > 0, b1 > b2

Notese que esta expresion tiene la forma de la ecuacion diferencial en (3.4)


de manera que b1 , b2 , h y hd juegan los papeles, respectivamente,de a, k, y y
u. Entonces la solucion h(t) tiene la misma forma que (3.14), es decir:

b2 hd b1 t b2 hd
h(t) = e + + h0 eb1 t , h0 = h(0)
b1 b1
Notese que, debido a que b1 > b2 > 0:
b2 h d
lm h(t) = < hd (3.96)
t b1
es el valor que alcanza en estado estacionario el nivel de agua en el tanque y es
menor (diferente) que el nivel deseado hd . Esto puede explicarse usando (3.92)
del siguiente modo. La funcion de transferencia de la ecuacion diferencial en
(3.95) es:

H(s) b2
G(s) = =
Hd (s) s + b1

Entonces:
b2 h d b2
lm h(t) = lm sH(s) = lm s = h d < hd
t s0 s0 s + b1 s b1
Ahora bien, este resultado tambien puede explicarse usando la experiencia
cotidiana del siguiente modo. Supongase por un momento que lmt h(t) =
hd . Entonces, de acuerdo a (3.93) y (3.94):

qi = k1 kp (hd h) = 0

el flujo de agua que entra al tanque es cero porque h = hd . Como el agua con-
tinua fluyendo a traves de la valvula de salida, qo 6= 0, lo anterior resultara en
h < hd de nuevo. Esto significa que no es posible mantener h = hd de manera
permanente, lo que justifica el resultado en (3.96).
Ahora suponga que se usa (3.93) junto con:
Z t
u = kp (hd h) + ki (hd h(r))dr (3.97)
0

donde ki es una constante positiva. Combinando (3.93), (3.97) y (3.26) se


obtiene:
Z t
dh
+ ah = kk1 kp (hd h) + ki (hd h(r))dr
dt 0
148 3 Base matematica: ecuaciones diferenciales

Derivando una vez respecto al tiempo a toda la ecuacion se tiene:



d2 h dh d
+a = kk1 kp (hd h) + ki (hd h)
dt2 dt dt
Agrupando terminos:
d2 h dh dhd
2
+ (a + kk1 kp ) + kk1 ki h = kk1 kp + kk1 ki hd
dt dt dt
Usando la transformada de Laplace bajo la suposicion de condiciones iniciales
iguales a cero se obtiene la siguiente funcion de transferencia:
H(s) kk1 kp s + kk1 ki
G(s) = = 2
Hd (s) s + (a + kk1 kp )s + kk1 ki

Usando (3.92) se obtiene:


kk1 kp s + kk1 ki hd kk1 ki
lm h(t) = lm sH(s) = lm s = hd = hd
t s0 s0 s2 + (a + kk1 kp )s + kk1 ki s kk1 ki
(3.98)

lo cual es completamente cierto si a + kk1 kp > 0 y kk1 ki > 0 (se deja como
ejercicio consultar la seccion 4.2.1, del captulo 4, para verificar que estas
condiciones aseguran que las dos races del polinomio caracterstico s2 + (a +
kk1 kp )s + kk1 ki tienen parte real negativa). De nuevo, este resultado puede
ser explicado usando la experiencia cotidiana. Dado que h = hd en estado
estacionario, entonces es de esperarse que la senal de error e = hd h tenga un
comportamiento
Rt como el mostrado en la figura 3.17. Recuerdese que la integral
0
(h d h(r))dr es el area debajo de la curva mostrada en la figura 3.17 la cual
es positiva. Esto significa que cuando h = hd la integral permanece constante
(el integrando vale cero) en un valor positivo. Entonces, de acuerdo a (3.93)
y (3.97) continua entrando agua al tanque con un flujo qi que permanece
constante en este valor positivo multiplicado por k1 ki > 0. Este flujo resulta
ser exactamente igual al flujo del agua que sale qo de manera que el nivel de
agua h = hd permanece igual al nivel deseado, tal como lo predice (3.98).

Ejemplo 3.18 Considere el sistema masa-resorte-amortiguador estudiado en


el ejemplo 3.6 pero ahora suponga que no hay ningun resorte. Haciendo K = 0
en (3.63) se obtiene:

mx + bx = f

Suponga que se utiliza algun dispositivo (un motor tan rapido que su ecuacion
diferencial puede no ser considerada, por ejemplo) que genera una fuerza de
acuerdo a la siguiente expresion:

f = kp (xd x) (3.99)
3.8 Una ecuacion diferencial general 149

e [m]

t [s]

Rt
Figura 3.17. La integral 0 (hd h(r))dr es el area sombreada debajo de la curva
definida por e = hd h. Se supone que hd > h(0).

donde kp es una constante positiva, xd es una constante que representa la


posicion deseada y x es la posicion medida del carrito. Combinando estas
expresiones se obtiene:

mx + bx = kp (xd x)

y agrupando:
b kp kp
x + x + x = xd
m m m
Usando la transformada de Laplace bajo la suposicion de condiciones iniciales
iguales a cero se encuentra la siguiente funcion de transferencia:
kp
X(s) m
G(s) = = kp
Xd (s) s2 + b
ms + m

Se deja como ejercicio encontrar las races del polinomio caracterstico s2 +


b kp b kp
m s + m y comprobar que ambas tienen parte real negativa si m > 0 y m > 0.
Entonces, usando (3.92) se encuentra que la posicion alcanzada en estado
estacionario:
kp kp
m xd m
lm x(t) = lm sX(s) = lm s kp
= kp
xd = xd
t s0 s0 s2 + b s
ms + m m

es igual a la posicion deseada xd . La razon de este resultado puede explicar-


se usando, de nuevo, la experiencia: cuando x = xd la fuerza producida de
acuerdo a (3.99) es f = 0 por lo que el carrito puede detenerse y permanecer
en dicha posicion. Mas aun, si x < xd entonces f > 0 y el carrito incrementa
su posicion x acercandose a xd (vease la figura 3.12 para recordar la direccion
en se aumenta x y en la que f es positiva). Si x > xd entonces f < 0 y el
carrito decrementa su posicion x acercandose, de nuevo, a xd .
150 3 Base matematica: ecuaciones diferenciales

Se deja como ejercicio que el lector haga el analisis correspondiente para


verificar que en el caso que exista un resorte, es decir cuando K > 0, entonces
lmt x(t) 6= xd si xd 6= 0. Notese sin embargo que, de nuevo, esto puede
explicarse de manera sencilla usando la experiencia:
Si x = xd entonces, de acuerdo a (3.99), la fuerza externa aplicada sobre
el carrito es cero f = 0 y la fuerza de friccion tambien es cero bx = 0 si se
supone que el carrito ya esta en reposo. Sin embargo, si x = xd 6= 0 entonces
la fuerza del resorte sobre el carrito Kx es diferente de cero por lo que el
carrito abandonara la posicion x = xd 6= 0. El carrito alcanzara el reposo en
una posicion x tal que la fuerza del resorte y la fuerza f en (3.99) se cancelen
exactamente, es decir, donde kp (xd x) = Kx.

3.9. Polos y ceros en sistemas de orden superior


En los sistemas de orden 3 o mayor no es posible hacer un estudio grafico
detallado de la respuesta y(t) como se ha hecho en el caso de sistemas de pri-
mer y segundo orden. La principal razon es la complejidad de las expresiones
obtenidas cuando una funcion de transferencia tiene tres polos o mas. Por esta
razon, cuando se tiene un sistema de orden alto es importante poder apro-
ximarlo usando un sistema de orden menor. Hay dos maneras de conseguir
esto: i) cancelando algunos polos con algunos ceros de la funcion de transfe-
rencia correspondiente e ii) despreciando el efecto de los polos rapidos. A
continuacion se presentan algunos ejemplos de como se puede hacer esto.

3.9.1. Cancelacion polo-cero y modelos reducidos

Considere el siguiente sistema de segundo orden:

k(s d)
Y (s) = U (s) (3.100)
(s p1 )(s p2 )

Suponga que U (s) = A/s, p1 6= p2 , p1 < 0, p2 < 0, d < 0, y que p1 p2 kd


con el fin de que la funcion de transferencia en (3.100) sea de ganancia apro-
ximadamente unitaria en estado estacionario. Usando expansion en fracciones
parciales:

k(s d) A B C D
Y (s) = = + + (3.101)
(s p1 )(s p2 ) s s p1 s p2 s

Multiplicando ambos miembros por el factor (s p1 ) y evaluando en s = p1


se obtiene:

k(s d)A k(p1 d)A
B= =
(s p2 )s s=p1 (p1 p2 )p1
3.9 Polos y ceros en sistemas de orden superior 151

Multiplicando ambos miembros de (3.101) por el factor (s p2 ) y evaluando


en s = p2 se obtiene:

k(s d)A k(p2 d)A
C= =
(s p1 )s (p2 p1 )p2
s=p2

Multiplicando ambos miembros de (3.101) por el factor s y evaluando en s = 0


se obtiene:

k(s d)A kdA
D= =
(s p1 )(s p2 ) s=0 p1 p2
Si p1 d < 0 entonces, de acuerdo a la condicion p1 p2 kd, se tiene que
k p2 y, por tanto:
B0 (3.102)
k(p2 d)A kA
C = (3.103)
(p2 d)p2 p2
kA
D (3.104)
p2
para obtener finalmente:
kA p2 t kA
y(t) e (3.105)
p2 p2
El lector puede verificar que:
kA p2 t kA
y(t) = e (3.106)
p2 p2
es la solucion de:
k
Y (s) = U (s) (3.107)
s p2
con U (s) = A/s y k = p2 . Por tanto, se concluye. Si un polo y un cero de una
funcion de transferencia estan muy cercanos, entonces se pueden cancelar para
obtener una funcion de transferencia de orden reducido. Es decir, se puede
usar (3.107) en lugar de (3.100) para obtener resultados muy similares. Las
ventajas de usar el modelo (3.107) son: i) se trata un modelo de orden menor
que (3.100) e ii) no tiene ningun cero. La ventaja de disponer de un modelo de
orden reducido que describe aproximadamente a un modelo de orden superior
es que con mucha frecuencia el modelo reducido es de orden suficientemente
pequeno de modo que su respuesta puede especificarse graficamente como
el de un sistema de primer o segundo orden. Por otro lado, un cero en la
funcion de transferencia modifica su respuesta de una manera que no es facil
de cuantificar por lo que es muy conveniente que la funcion de transferencia
no tenga ceros.
Es importante mencionar que la cancelacion de un polo y un cero solo es
permitida si ambos tienen parte real negativa, pues de otro modo su efecto se
hara presente, tarde o temprano, conforme el tiempo crece.
152 3 Base matematica: ecuaciones diferenciales

3.9.2. Polos dominantes y modelos reducidos

Considere la siguiente funcion de transferencia:


k d
Y (s) = 1 s + a U (s) (3.108)
s + RC

donde U (s) = A/s. Usando expansion en fracciones parciales:


k d A B C D
Y (s) = 1 s+a s = 1 + s+a + s (3.109)
s + RC s + RC
1 1
Multiplicando ambos miembros por el factor s+ RC y evaluando en s = RC :

d A d A
B=k =k 1 (3.110)
s + a s s= 1 1
a RC RC
RC

Multiplicando ambos miembros de (3.109) por el factor s + a y evaluando en


s = a:

d A d A
C=k 1 s =k 1 (a) (3.111)
s + RC s=a
a + RC

Multiplicando ambos miembros de (3.109) por el factor s y evaluando en s = 0:



d A d A
D=k 1 (s + a) =k 1 (3.112)
s + RC s=0 RC
a
1
Si a RC > 0 entonces:

d A
B k 1 (3.113)
a RC
dA
C k 2 D (3.114)
a
Por tanto, usando (3.109) y despreciando C se obtiene:
d A 1 t d A
y(t) k 1 e
RC + k
1 a (3.115)
a RC RC

El lector puede verificar que:


d A 1 t d A
y(t) = k 1 e
RC + k
1 a (3.116)
a RC RC

es la solucion de:
kd
Y (s) = 1 U (s) (3.117)
a(s + RC )
3.9 Polos y ceros en sistemas de orden superior 153

con U (s) = A/s. Por tanto, se puede utilizar (3.117) en lugar de (3.108). La
1
condicion a RC se interpreta diciendo que el polo en s = a es muy
1 1
rapido comparado con el polo en s = RC . Al polo en s = RC se le conoce
como el polo dominante porque su efecto es el que sobresale en la respuesta del
sistema. Por tanto, se concluye. Si un polo es mucho mas rapido que los otros,
entonces se puede obtener una funcion de transferencia de orden reducido si
se desprecia el polo rapido y se conservan los polos dominantes (lentos). Un
criterio aceptado es que los polos rapidos (los que se pueden despreciar) tienen
una parte real de al menos 5 veces la parte real de los polos dominantes (los que
se conservan). Notese, sin embargo, que no es cuestion de simplemente hacer
desaparecer el factor s + a en el denominador de la funcion de transferencia:
la constante a aun aparece dividiendo en (3.117) porque es necesaria para
conservar la ganancia en estado estacionario de la funcion de transferencia en
(3.108).
Una manera sencilla de obtener (3.117) a partir de (3.108) es la siguiente:

k d k d
Y (s) = 1 s + a U (s) = 1 U (s) (3.118)
s + RC s + RC a( a1 s + 1)
1
Si a es muy grande se puede suponer que as 1 y, por tanto:

kd
Y (s) 1 U (s) (3.119)
a(s + RC )

que es la expresion en (3.117).


Finalmente, es importante mencionar que una reduccion de orden como la
presentada es valida solo si el polo que se desprecia tiene parte real negativa.
Si el polo que se desprecia tiene parte real positiva entonces, por pequena que
sea C la contribucion de este polo crecera con el tiempo hasta el infinito y no
podra ser despreciada de ninguna manera.

Ejemplo 3.19 De acuerdo al ejercicio 9 y el ejemplo 2.12 del captulo 2, el


modelo de un motor de CD esta dado como:
dia
La = Ra ia ke ,
dt
d
J = km ia B (3.120)
dt
donde es la velocidad del motor (veanse tambien (9.9) y (9.10) del captu-
lo 9). Suponga que este motor acciona un sistema hidraulico que por efecto
centrfugo produce un flujo de agua, qi , que es proporcional a la velocidad del
motor, es decir, qi = , donde es una constante positiva. Finalmente, este
flujo de agua es utilizado para llenar el tanque del ejemplo 3.2 en el presente
captulo, cuyo modelo esta dado en (3.26) y que por facilidad de referencia se
reescribe a continuacion:
154 3 Base matematica: ecuaciones diferenciales

dh
+ ah = kqi
dt
1 1
a= , k=
RC C
Usando la transformada de Laplace (3.1) y considerando todas las condiciones
iniciales iguales a cero, no es difcil comprobar que las ecuaciones correspon-
dientes adquieren la forma:
1/La
I(s) = (V (s) ke (s)) (3.121)
s+ R a
La
km /J
(s) = I(s) (3.122)
s+ BJ
1/C
H(s) = 1 Qi (s) (3.123)
s + RC

Combinando (3.121) y (3.122) se obtiene:

km /J 1/La
(s) = (V (s) ke (s))
s+ B Ra
J s + La

De acuerdo a (3.118) se puede escribir:

k /J 1/La
(s) = B
Jm (V (s) ke (s))
Bs + 1
Ra La
J La Ra s + 1

En motores de CD pequenos, la inductancia La y la constante de friccion


La J
viscosa B son pequenas por lo que Ra
B . Por tanto, se puede considerar
La
que Ra s 1 solamente y que entonces se puede aproximar:

1 km
(s) = (V (s) ke (s))
s+ B
J
JR a

Para continuar, se pueden reagrupar los terminos que contienen (s) para
reescribir esta expresion del siguiente modo:
km
JR V
(s) = (s)
B km ke
s+ J + JRa

Sustituyendo esto y Qi (s) = (s) en (3.123) se encuentra:


1 km
C JR V
H(s) = 1 (s)
s+ RC s+ B
+ km ke
J JRa

Procediendo de nuevo como en (3.118) se puede escribir:


3.10 El principio de superposicion 155
km
C JR
H(s) = 1 V (s)
RC (RCs + 1) B km ke 1
J + JRa B
+ km ke
s+1
J JRa

Si el tanque tiene una seccion suficientemente amplia, el motor alcanzara su


velocidad nominal mucho tiempo antes de que el nivel de agua en el tanque
se incremente apreciablemente. Esto se cuantifica de manera mas precisa es-
tableciendo que la constante de tiempo del tanque es muy grande comparada
con la constante de tiempo del motor, es decir, que RC B + k1m ke . Enton-
J JRa
1
ces, se puede decir que B km ke s 1 solamente y que, por tanto, se puede
J + JRa
aproximar:
km
C JR V
H(s) = 1 (s)
(RCs + 1) B km ke
RC J + JRa

o bien:
1 km
C JR V
H(s) = 1 (s)
s+ B km ke
RC J + JRa

Por lo que definiendo:


km
JR
k1 = B km ke
J + JRa

y comparando con (3.123) se justifica la expresion presentada en (3.93), es


decir, que se puede considerar que el flujo de agua es proporcional al vol-
taje aplicado al motor a traves de una constante k1 . Esto es posible si: 1)
la constante de tiempo de la dinamica electrica del motor es mas pequena
que la constante de tiempo de la dinamica mecanica del motor, es decir si
La J
Ra B , y 2) si la constante de tiempo del tanque es muy grande comparada
con la constante de tiempo del motor completo, es decir si RC B + k1m ke .
J JRa
Finalmente, es importante mencionar que este procedimiento es valido porque
B km ke Ra
J + JRa > 0 y La > 0, es decir, los polos despreciados son negativos.

3.10. El principio de superposicion


Toda ecuacion diferencial lineal satisface el principio de superposicion. Mas
aun, el hecho de que una ecuacion diferencial satisfaga el principio de super-
posicion se acepta como una prueba de que la ecuacion diferencial es lineal.
Con el fin de simplificar la exposicion, a continuacion se presenta el principio
de superposicion para el caso en el que todas las condiciones iniciales son cero.
156 3 Base matematica: ecuaciones diferenciales

Principio de superposicion. Considere la siguiente ecuacion diferencial


ordinaria, lineal con coeficientes constantes de orden n:
y (n) + an1 y (n1) + + a1 y + a0 y = b0 u + b1 u + + bm u(m) (3.124)
donde n m. Suponga que todas las condiciones iniciales son cero. Suponga
tambien que y1 (t) es la solucion de (3.124) cuando u1 (t) se usa como entra-
da y que y2 (t) es la solucion de (3.124) cuando u2 (t) se usa como entrada.
Entonces, 1 y1 (t) + 2 y2 (t), donde 1 y 2 son constantes arbitrarias, es la
solucion de (3.124) cuando 1 u1 (t) + 2 u2 (t) se usa como entrada.

A continuacion se presenta una manera de comprobar este resultado. Como


la ecuacion diferencial en (3.124) es lineal y todas las condiciones iniciales son
cero entonces se puede expresar en terminos de su funcion de transferencia:
Y (s) = G(s)U (s) (3.125)
Esto significa que se puede escribir:
Y1 (s) = G(s)U1 (s)
Y2 (s) = G(s)U2 (s)
Sumando estas expresiones se obtiene:
1 Y1 (s) + 2 Y2 (s) = 1 G(s)U1 (s) + 2 G(s)U2 (s)
= G(s)(1 U1 (s) + 2 U2 (s))
Esto es posible gracias a que 1 y 2 son constantes. Esta expresion comprueba
que 1 y1 (t) + 2 y2 (t) es la solucion de (3.125) y, por tanto, de (3.124) cuando
1 u1 (t) + 2 u2 (t) se usa como entrada.
Ejemplo 3.20 En el circuito mostrado en la figura 3.18(a) se desea conocer
el voltaje en la impedancia Z4 (s), segun la polaridad mostrada. Con el fin
de simplificar el circuito y conseguir el objetivo planteado, se hara uso de un
resultado importante en el analisis de circuitos: el teorema de intercambio de
fuentes.
Teorema 3.1 Teorema de intercambio de fuentes [5], pag. 214, [11],
pag. 61.
Cuando se tiene en serie una impedancia, Z(s), y una fuente de vol-
taje, Vf v (s), entre dos terminales a y b, se le puede sustituir por una
fuente de corriente, If c (s), conectada en paralelo a la misma impedan-
cia del circuito serie. La magnitud de la fuente de corriente es igual a
If c (s) = Vf v (s)/Z(s).
Cuando se tiene en paralelo una impedancia, Z(s), y una fuente de corrien-
te, If c (s), entre dos terminales a y b, se le puede sustituir por una fuente de
voltaje, Vf v (s), conectada en serie a la misma impedancia del circuito pa-
ralelo. La magnitud de la fuente de voltaje es igual a Vf v (s) = Z(s)If c (s).
3.10 El principio de superposicion 157

Z 1(s) Z 5(s)

Z 3(s)

V 1(s) + Z 2(s) + V (s)


2
+
Z 4(s)

(a)

Z 3(s)

I 1(s) Z 1(s) Z 2(s) Z 5(s) I 2(s)


+
Z 4(s)

(b)

I 3(s)
I a (s)
Z 3(s)

I 1(s) + I 2(s) Z a (s)


+
Z 4(s)

(c)

Figura 3.18. Circuito electrico estudiado en el ejemplo 3.20.

Aplicando la primera parte de este resultado a las fuentes V1 (s) y V2 (s), se


obtiene el circuito de la figura 3.18(b) donde:

V1 (s) V2 (s)
I1 (s) = , I2 (s) = (3.126)
Z1 (s) Z5 (s)

Es claro que Z1 (s), Z2 (s) y Z5 (s) estan conectadas en paralelo y su equivalente


es (vease (2.139)):
1
Za (s) = 1 1 1
Z1 (s) + Z2 (s) + Z5 (s)
158 3 Base matematica: ecuaciones diferenciales

Usando esto y la combinacion de las fuentes de corriente se obtiene el circuito


de la figura 3.18(c). A continuacion se hara uso de otro resultado importante
en el analsis de circuitos electicos: el divisor de corriente.
Resultado 3.1 Divisor de corriente [5], pag. 176, [11], pag. 38.
Cuando se tienen dos impedancias en paralelo que estan a su vez conectadas
en paralelo a una fuente de corriente, la corriente que circula por cualquier
impedancia es igual a el valor de la fuente de corriente multiplicada por la
impedancia contraria a la que se desea calcular la corriente y dividida ente la
suma de las dos impedancias.
Por tanto, aplicando la regla de divisor de corriente y la Ley de Ohm al circuito
en la figura 3.18(c) se obtienen las siguientes relaciones:
Za (s)
I3 (s) = (I1 (s) + I2 (s))
Za (s) + Z3 (s) + Z4 (s)
Vz4 (s) = Z4 (s)I3 (s)

donde Vz4 (s) es el voltaje en la impedancia Z4 (s). Combinando estas expre-


siones se obtiene:
Za (s)Z4 (s)
Vz4 (s) = (I1 (s) + I2 (s))
Za (s) + Z3 (s) + Z4 (s)
Finalmente, utilizando (3.126) se encuentra:

Za (s)Z4 (s) V1 (s) V2 (s)
Vz4 (s) = +
Za (s) + Z3 (s) + Z4 (s) Z1 (s) Z5 (s)
Se concluye que el voltaje en la impedancia Z4 (s) se puede obtener como la su-
ma de los voltajes en Z4 (s) debidos a cada una de las fuentes, V1 (s) y V2 (s),
cuando la otra fuente es puesta en corto circuito (igual a cero) y sumando
ambos resultados. Esto es precisamente lo que establece el principio de super-
posicion. Es interesante subrayar que el principio de superposicion ha sido
establecido mas arriba en la presente seccion, suponiendo que las diferentes
entradas se suman directamente y luego se aplican al sistema. Sin embargo,
este ejemplo muestra que el principio de superposicion es valido en sistemas
lineales aun y cuando las fuentes de voltaje, V1 (s) y V2 (s), no se pueden sumar
inmediatamente (vease la figura 3.18(a)).
Ejemplo 3.21 En el circuito mostrado en la figura 3.19(a) se desea conocer
el voltaje en la impedancia Z3 (s), segun la polaridad mostrada. Con el fin de
simplificar el problema y conseguir el objetivo planteado, primero se obtiene el
circuito equivalente mostrado en la figura 3.19(b). Entonces se puede hacer uso
del teorema de intercambio de fuentes (vease el ejemplo previo) para obtener
el circuito de la figura 3.19(c), donde:
V1 (s)
I1 (s) = (3.127)
Z1 (s)
3.10 El principio de superposicion 159

Z 1(s)

+
Z 3(s)
+
V 1(s) Z 2(s) Z 4(s)

+ V (s)
2

(a)
Z 1(s) Z 3(s)

V 1(s) + Z 2(s) Z 4(s) + V (s)


2

(b)
Z 3(s)

I 1(s) Z 1(s) Z 2(s) Z 4(s) + V (s)


2

(c)
Z a (s) Z 3(s) I(s)

V 3(s) + + V 2(s)

(d)

Figura 3.19. Circuito electrico estudiado en el ejemplo 3.21.


160 3 Base matematica: ecuaciones diferenciales

Como las impedancias Z1 (s), Z2 (s) y Z4 (s) estan conectadas en paralelo,


se encuentra que su equivalente esta dado como (vease (2.139)):
1
Za (s) = 1 1 1
Z1 (s) + Z2 (s) + Z4 (s)

Como la impedancia equivalente Za (s) queda conectada en paralelo con la


fuente de corriente I1 (s), se puede usar la segunda parte del teorema de in-
tercambio de fuentes, listado en el ejemplo previo, para obtener el circuito de
la figura 3.19(d), donde:

V3 (s) = Za (s)I1 (s)


V3 (s) V2 (s)
I(s) =
Za (s) + Z3 (s)
Vz3 (s) = Z3 (s)I(s)

donde Vz3 (s) es el voltaje en la impedancia Z3 (s). Combinando estas expre-


siones y usando (3.127) se obtiene:

Z3 (s)
Vz3 (s) = (V3 (s) V2 (s))
Za (s) + Z3 (s)
Z3 (s)
= (Za (s)I1 (s) V2 (s))
Za (s) + Z3 (s)

Z3 (s) Za (s)
= V1 (s) V2 (s)
Za (s) + Z3 (s) Z1 (s)

Se concluye, de nuevo, que el voltaje en la impedancia Z3 (s) se puede obtener


como la suma de los voltajes en Z3 (s) debidos a cada una de las fuentes,
V1 (s) y V2 (s), cuando la otra fuente es puesta en corto circuito (igual a cero)
y sumando ambos resultados. Ademas, este ejemplo tambien muestra que el
principio de superposicion es valido en sistemas lineales aun y cuando las
fuentes de voltaje, V1 (s) y V2 (s), no se pueden sumar inmediatamente (vease
la figura 3.19(a)).

3.11. Caso de estudio. Un convertidor electronico de


potencia de CD a CD tipo resonante serie de alta
frecuencia

En la seccion 2.7 del captulo 2 se obtuvo el modelo matematico de un


convertidor electronico de potencia de CD a CD tipo resonante serie de alta
frecuencia. Este modelo es presentado en (2.186)-(2.188) y a continuacion se
reescribe para facilitar la referencia:
3.11 Caso de estudio 161

di
L = v v0 sign(i) + E(t) (3.128)
dt
dv
C =i (3.129)
dt
dv0 v0
C0 = abs(i) (3.130)
dt R
donde:

+1, i > 0
sign(i) = (3.131)
1, i < 0

mientras que abs(i) representa el valor absoluto de i. En la presente seccion se


estudiara el funcionamiento de este circuito mediante la solucion del modelo
en (3.128)-(3.130). Para esto, es de mucha utilidad realizar un cambio de
coordenadas para las variables involucradas en el modelo. Por esta razon se
definen las siguientes variables (vease la seccion 2.7 del captulo 2 para una
explicacion del significado de los parametros involucrados):
r
i L v v0 t
z1 = , z2 = , z3 = , = (3.132)
E C E E LC
Sustituyendo esto en (3.128), (3.129), (3.130) se tiene:
q
d E C z
L 1
L = Ez2 Ez3 sign(z1 ) + E(t)
d LC
r
d (Ez2 ) C
C = z1 E
d LC L
r !
d(Ez3 ) C Ez3
C0 = abs E z1
d LC L R

Simplificando se encuentra:

z1 = z2 z3 sign(z1 ) + u (3.133)
z2 = z1 (3.134)
z3
z3 = abs(z1 ) (3.135)
Q
donde el punto representa lapderivada respecto al tiempo normalizado
mientras que = C0 /C, Q = R C/L y u es una variable que solo toma los
valores de +1 (cuando E(t) = +E) y 1 (cuando E(t) = E). Normalmente,
el valor del capacitor de salida C0 se selecciona muy grande comparado con
el valor del capacitor resonante C porque esto asegura que z3 , es decir v0 , se
mantendra aproximadamente constante durante varios ciclos de la corriente
162 3 Base matematica: ecuaciones diferenciales

resonante z1 , es decir i. Por tanto, bajo esta suposicion (z3 constante), se


puede despreciar (3.135) y el uso de (3.133) y (3.134) es suficiente para re-
presentar la evolucion de las variables resonantes z1 y z2 , al menos durante
varias oscilaciones.
Por otro lado, para conseguir que el circuito opere en resonancia, los tran-
sistores Q1 , Q3 se activan (conducen) cuando z1 > 0 (es decir i > 0) con lo
que u = +1 (porque E(t) = +E en este caso), de acuerdo a las figuras 2.44(a),
2.45 y 2.46, mientras que los transistores Q2 , Q4 se activan (conducen) cuando
z1 < 0 (es decir i < 0) con lo que u = 1 (porque E(t) = E en este ca-
so). Una manera abreviada de indicar esto es especificando que u = sign(z1 ),
donde sign(z1 ) = +1 si z1 > 0 y sign(z1 ) = 1 si z1 < 0. Lo anterior significa
que, de acuerdo a (3.133) y (3.134), la evolucion de las variables resonantes
puede ser descrita como:
z1 = z2 + ve (3.136)
z2 = z1 (3.137)

1 z3 , Q1 , Q3 conducen
ve =
(1 z3 ), Q2 , Q4 conducen
donde z3 se considera constante. Aplicando el cambio de variable z4 = z2 ve
a las ecuaciones anteriores se obtiene z4 = z2 = z1 , porque ve = 0 al ser ve
constante, y z4 = z1 = z2 + ve = z4 , es decir:
z4 + z4 = 0 (3.138)
Notese que se trata de una ecuacion diferencial ordinaria, de segundo orden,
lineal y de coeficientes constantes, como la definida en (3.40) con = 0 y
n = 1. Como ademas la excitacion, o entrada, de esta ecuacion diferencial es
igual a cero entonces A = 0 y la solucion completa esta dada por la respuesta
natural unicamente. Por tanto, de acuerdo a la seccion 3.3 y, en particular, a
(3.49) y (3.50), la solucion de (3.138) esta dada como:

1 z40 (s + 2n ) + z40 1 z40 s + z40
z4 ( ) = p( ) = L =L
s2 + 2n s + n2 s2 + 1

z40 s z40
= L1 2
+ 2 = z40 cos( ) + z40 sin( ) (3.139)
s +1 s +1
donde se han usado los pares transformados [4], cap. 32:
( )
1 s
L = cos(a )
s2 + a2
( )
1 a
L = sin(a )
s2 + a2

mientras que z40 = z4 (0) = z2 (0) ve y z40 = z4 (0) = z1 (0). Derivando


(3.139) una vez respecto a se obtiene:
3.11 Caso de estudio 163

z4 ( ) = z40 sin( ) + z40 cos( ) (3.140)

Entonces, usando (3.139) y (3.140) es sencillo verificar que:

z42 ( ) + z42 ( ) = z40


2 2
+ z40 (3.141)

Esto significa que si la solucion de (3.138) se dibuja sobre un plano donde el eje
horizontal es z4 y el eje vertical es z4 , entonces se obtiene un crculo centrado
en el origen, (z4 , z4 ) = (0, 0), que tiene
p un radio (constante) determinado
por las condiciones iniciales, es decir z40 2 + z 2 . Mas aun, de acuerdo a los
40
cambios de variable z4 = z2 ve y z4 = z1 , se concluye que si la solucion
de (3.136), (3.137), se dibuja sobre un plano donde el eje horizontal es z2
y el eje vertical es z1 , entonces se obtiene un crculo centradop en el punto
(z2 , z1 ) = (ve , 0), que tiene un radio (constante) igual a (z20 ve )2 + z10 2

donde z20 = z2 (0) y z10 = z1 (0). Es importante mencionar que, de acuerdo a


(3.136) y (3.137), los valores de z1 y z2 no pueden presentar discontinuidades
porque para eso se necesitaran valores infinitos de z1 y z2 , respectivamente,
lo cual no es posible dado que los miembros derechos de (3.136) y (3.137)
no toman valores infinitos. Esto significa que, al combinar las soluciones en
ambas regiones (cuando z1 > 0 y cuando z1 < 0), las condiciones iniciales en
cada region deben ser iguales a los valores finales de la solucion alcanzados en
la region previa. Todo lo anterior se muestra graficamente en la figura 3.20. La
trayectoria cerrada mostrada en esta figura indica que las variables resonantes
z2 , z1 (es decir v e i) oscilan de manera permanente. Se debe subrayar que esta
trayectoria cerrada se recorre en sentido horario porque, de acuerdo a (3.137),
z2 crece cuando z1 > 0 (si z2 > 0 entonces z2 crece) y z2 disminuye cuando
z1 < 0. Notese que debido a que ve puede tomar dos valores diferentes, 1 z3
(cuando z1 > 0) y (1 z3 ) (cuando z1 < 0), la unica manera de conseguir
la situacion mostrada en la figura 3.20 es que z3 = 1, es decir, que ve = 0 en
ambas regiones. Esto significa que el voltaje entregado a la salida es igual al
voltaje de suministro v0 = E.
A continuacion se muestra como puede ser utilizado un convertidor re-
sonante serie de CD a CD para entregar voltajes de salida menores que la
unidad z3 < 1 (es decir v0 < E), lo cual es una aplicacion importante de este
tipo de convertidores. Sea la funcion s = z1 z2 , con una constante posi-
tiva, y asgnese u = sign(s). Esto define las regiones mostradas en la figura
3.21. Notese que los transistores Q1 , Q3 estan encendidos cuando u = +1 (por
encima de la lnea recta definida por z1 = z2 ), pero solo conducen cuando
z1 > 0 pues, aunque Q1 , Q3 esten encendidos, cuando z1 < 0 la corriente
electrica fluye a traves de los diodos D1 , D3 (cualquiera de los transistores
Q1 , Q2 , Q3 , Q4 solo conducen en una direccion). Por otro lado, los transistores
Q2 , Q4 estan encendidos cuando u = 1 (por debajo de la lnea recta definida
por z1 = z2 ), pero solo conducen cuando z1 < 0 pues, aunque Q2 , Q4 esten
encendidos, cuando z1 > 0 la corriente electrica fluye a traves de los diodos
D2 , D4 .
164 3 Base matematica: ecuaciones diferenciales

Z1

Z2
( 1 + Z3; 0) (1 Z3; 0)

Figura 3.20. Evolucion de las variables resonantes z2 y z1 cuando u = sign(z1 ).

Las variables resonantes siguen evolucionando de acuerdo a (3.136) y


(3.137) pero ahora ve toma los siguientes los valores constantes:


1 z3 , Q1 , Q3 conducen, (z1 > z2 , z1 > 0)

(1 z3 ), Q2 , Q4 conducen, (z1 < z2 , z1 < 0)
ve =

1 + z3 , D1 , D3 conducen, (z1 > z2 , z1 < 0)

(1 + z3 ), D2 , D4 conducen, (z1 < z2 , z1 > 0)

Esto significa que, de nuevo y de acuerdo a los argumentos establecidos entre


(3.136) y el parrafo que sigue de (3.141), las variables resonantes describen
crculos sobre el plano z2 z1 . El radio de estos crculos esta determinado
por las condiciones iniciales en cada region (iguales a los valores finales en
la region previa). El centro de estos crculos esta ubicado en los siguientes
puntos, dependiendo de la region en que se esta trabajando:

(z2 , z1 ) = (1 z3 , 0), z1 > z2 , z1 > 0,


3.11 Caso de estudio 165

z1
s=0
z 1 = z 2

z 1 > z 2
z1 > 0
Q1; Q3
z 1 < z 2
z1 > 0
D2; D4

1 z3 1 + z3 1 z3 1 + z3 z2

D1; D3 Q2; Q4
z 1 > z 2 z 1 < z 2
z1 < 0 z1 < 0

Figura 3.21. Evolucion de las variables resonantes z2 y z1 cuando u = sign(s) con


s = z1 z2 .

(z2 , z1 ) = (1 + z3 , 0), z1 < z2 , z1 < 0,


(z2 , z1 ) = (1 + z3 , 0), z1 > z2 , z1 < 0,
(z2 , z1 ) = (1 z3 , 0), z1 < z2 , z1 > 0
En la figura 3.21 se muestra la situacion correspondiente cuando = 3 que,
como antes, implica que las variables resonantes z2 , z1 (es decir v e i) oscilan de
manera permanente. El lector puede proceder del siguiente modo para obtener
la trayectoria cerrada mostrada en la figura 3.21. Proponga cualquier valor tal
que z3 < 1 y utilice cualquier punto sobre el plano z2 z1 como valor inicial.
Usando un compas dibuje crculos con centro en los puntos arriba listados
segun la region en cuestion. Recuerde que, segun se explico previamente y
de acuerdo a (3.137), estos crculos deben ser recorridos en sentido horario.
166 3 Base matematica: ecuaciones diferenciales

Notara que se empezara a obtener una trayectoria con forma de espiral, como
la lnea punteada mostrada en la figura 3.21, que finalmente terminara en una
trayectoria cerrada. El hecho de que dicha trayectoria cerrada sea alcanzada a
partir de cualquier punto inicial sobre el plano z2 z1 es una muestra de que
tal trayectoria cerrada es estable (o atractiva). El lector puede proceder de la
misma manera usando un valor z3 > 1 para verificar que en este caso no se
consigue alcanzar ninguna trayectoria cerrada. Esto es un indicativo de que
en un convertidor resonante serie no es posible obtener un voltaje de salida v0
que sea mayor que el voltaje de suministro E, es decir no es posible obtener
un valor de z3 mayor que la unidad (recuerdese que v0 = Ez3 ). Si se desea
un voltaje de salida tal que v0 > E se puede utilizar el convertidor resonante
paralelo mostrado en la figura 2.44(b).
Por otro lado, en la figura 3.21, los arcos de crculo con centro en
(z2 , z1 ) = (1 z3 , 0) y (z2 , z1 ) = (1 z3 , 0) se dibujan de manera conse-
cutiva. Entonces, si ambos estuvieran centrados en el origen (z2 , z1 ) = (0, 0),
juntos completaran un angulo de 180 grados. Sin embargo, los centros de estos
arcos de crculo estan colocados en el cuadrante donde z2 tiene signo contrario
al cuadrante donde esta ubicado dicho arco de crculo. Esta observacion junto
con el uso de geometra basica permite concluir que los arcos de crculo con
centro en (z2 , z1 ) = (1 z3 , 0) y (z2 , z1 ) = (1 z3 , 0) describen juntos un
angulo menor que 180 grados a pesar de que juntos completan un semiciclo
completo en ambas variables resonantes z2 , z1 . Por tanto, los cuatro arcos de
crculo que componen a la trayectoria cerrada completa en la figura 3.21 des-
criben juntos un angulo menor que 360 grados a pesar de que describen un
ciclo completo en ambas variables resonantes. Notese que la frecuencia con la
que se recorren los arcos de crculo mencionados sigue siendo n = 1 pero, de
acuerdo a lo recien explicado, ahora se requiere menos tiempo para realizar
una oscilacion completa porque los cuatro arcos de crculo describen un angu-
lo menor a la misma velocidad angular. Por tanto, la frecuencia de operacion
o de las variables resonantes es mayor que n = 1, es decir o > n . Usando
(3.132) se puede comprobar que:
n 1 o
nt = = , ot = > nt
LC LC LC
donde nt y ot representan, respectivamente, la frecuencia de resonancia del
circuito y la frecuencia de operacion del circuito, expresadas respecto a la
base de tiempo real t. Por tanto, se concluye que el circuito debe operar a
frecuencias mayores que la frecuencia de resonancia para entregar voltajes de
salida menores que el voltaje de suministro v0 < E (es decir z3 < 1). Por esta
razon, cuando los transistores se activan de acuerdo a la regla u = sign(s),
el circuito en las figuras 2.44(a) y 2.45 se denomina convertidor electronico
de potencia de CD a CD tipo resonante serie de alta frecuencia. Para mayor
informacion sobre convertidores de potencia de CD a CD tipo resonantes
se recomienda consultar [8], donde se disenan, construyen, controlan y se
prueban experimentalmente (ambos tipos: serie y paralelo), y [7], donde se
3.12 Resumen del captulo 167

abunda sobre el metodo aqu presentado para obtener la respuesta de un


convertidor resonante serie usando arcos de crculo. Por otro lado, en [9] y [10]
se introdujo por primera vez el uso del plano de fase (z2 z1 ) para estudiar
el funcionamiento de convertidores electronicos de potencia tipo resonantes.

3.12. Resumen del captulo

Los sistemas que interesa controlar en ingeniera, as como cada uno de


los componentes de un sistema de control en lazo cerrado, estan descritos
por ecuaciones diferenciales ordinarias, lineales, de coeficientes constantes.
As que, para el ingeniero de control, el estudio de las ecuaciones diferenciales
debe estar dirigido hacia la comprension de las caractersticas de una ecuacion
diferencial que determinan la forma grafica de la solucion.
La solucion de una ecuacion diferencial lineal y de coeficientes constantes
esta dada como la suma de la respuesta natural y la respuesta forzada. La
respuesta natural depende exclusivamente del polinomio caracterstico de la
ecuacion diferencial y siempre esta presente, aunque la excitacion o entrada
sea igual a cero. En cambio, la respuesta forzada depende de la entrada apli-
cada y si esta es cero entonces la respuesta forzada tambien es cero. Cuando el
polinomio caracterstico no tiene races con parte real igual a cero y la entra-
da es un polinomio del tiempo, entonces la respuesta forzada tambien es un
polinomio del tiempo del mismo grado que la entrada. La importancia de este
hecho es que, si la respuesta natural tiende a cero (si la ecuacion diferencial
es estable), entonces la respuesta total convergera a la respuesta forzada. Por
tanto, la entrada de una ecuacion diferencial puede ser seleccionada de modo
tal que represente la manera en que se desea se comporte la solucion de la
ecuacion diferencial.
De este modo, el diseno de sistemas de control se reduce a lo siguiente:
dado un sistema a controlar (ecuacion diferencial), seleccionar un controlador
(otra ecuacion diferencial, en general) para que al ser conectado en realimen-
tacion con el sistema a controlar se obtenga una nueva ecuacion diferencial
que 1) sea estable, 2) la respuesta forzada sea igual a la entrada aplicada al
sistema realimentado (o valor deseado a la salida) y 3) que la respuesta natural
desaparezca suficientemente rapido y sin producir demasiadas oscilaciones.
Las caractersticas listadas en el parrafo anterior se consiguen del siguiente
modo:

1. Estabilidad. Esta propiedad esta determinada exclusivamente por las


races del polinomio caracterstico de la ecuacion diferencial o, equiva-
lentemente, de los polos de la funcion de transferencia que representa al
sistema de control (vease la seccion 3.8).
2. Respuesta en estado estacionario. Este aspecto tiene que ver con el con-
seguir que la respuesta forzada sea igual a la entrada aplicada al sistema
realimentado. En la seccion 3.8 se indica que, en el caso de que la entrada
168 3 Base matematica: ecuaciones diferenciales

sea una constante, esto esta determinado por los terminos independientes
de los polinomios de la funcion de transferencia.
3. Respuesta transitoria. Este aspecto se refiere a darle la forma adecuada a
la respuesta natural y depende de la seleccion adecuada de los polos de la
funcion de transferencia en lazo cerrado.

En los captulos 5, 6, 7 se estudia la manera de disenar controladores para


plantas arbitrarias usando los metodos del lugar de las races, la respuesta
en frecuencia y la variable de estado. La idea es conseguir que el sistema en
lazo cerrado sea estable, que la respuesta en estado estacionario sea igual a la
entrada del sistema en lazo cerrado (para cualquier entrada) y que la respuesta
transitoria tenga la forma mas adecuada.

3.13. Preguntas de Repaso

1. Por que una funcion de transferencia es inestable si tiene un polo con


parte real cero que esta repetido dos o mas veces?
2. Se ha dicho que la respuesta forzada tiene la misma forma que la entrada
Por que esto puede no ser cierto si la funcion de transferencia tiene polos
con parte real cero? De un ejemplo de una entrada y una funcion de
transferencia para las cuales esto pueda suceder.
3. Cuando una lampara incandescente (foco) se enciende, se calienta. Sin
embargo, la temperatura del foco no crece de manera indefinida sino que se
detiene en un cierto valor. De todas las ecuaciones diferenciales estudiadas,
Cual cree usted que mejor describe la evolucion de la temperatura del
foco? Por que?
4. Que relacion existe entre una funcion de transferencia y una ecuacion
diferencial?
5. Cuales son las cuatro reglas que determinan la estabilidad de una funcion
de transferencia?
6. Bajo que condiciones un motor de CD con escobillas podra comportarse
como un integrador? Y como un doble integrador?
7. Como cree que sera la grafica de la solucion completa (respuesta natural
mas respuesta forzada) de una ecuacion diferencial que tiene dos pares de
polos complejos conjugados poco amortiguados: un par con parte imagi-
naria mucho mas grande que la parte imaginaria del otro par?
8. Como cree que sera la grafica de la respuesta natural de una ecuacion
diferencial de segundo orden con dos races reales, repetidas y negativas?
9. Se ha visto que las funciones del tiempo que forman parte de la respuesta
natural estan determinadas por los polos de la funcion de transferencia
(races del polinomio caracterstico) pero, Cual es el efecto que tienen
los ceros de la funcion de transferencia? De que cree que dependen los
coeficientes de las fracciones parciales obtenidas antes de aplicar la trans-
formada inversa de Laplace? (vea las secciones 3.1 y 3.9).
3.14 Ejercicios propuestos 169

10. Dibuje el plano complejo s y sobre el ubique la zona donde deben colocarse
i) los polos reales que corresponden a respuestas rapidas, ii) los polos
complejos conjugados que corresponden a respuestas poco oscilatorias, iii)
los polos complejos conjugados que corresponden a respuestas rapidas, iv)
los polos complejos conjugados que corresponden a respuestas que oscilan
de manera permanente y v) los polos inestables.

3.14. Ejercicios propuestos


1. Considere el tanque con agua descrito en el ejemplo 3.2. La grafica mos-
trada en la figura 3.22 se obtiene cuando se aplica un flujo qi constante y
el tanque tiene una seccion de 0.5[m2 ]. Encuentre los valores de R y qi .

h
[m]

t [s]

Figura 3.22. Nivel en un tanque cuando se aplica un flujo de entrada constante.

2. Considere el control proporcional de nivel presentado en el ejemplo 3.17


(cuando se usa u = kp (hd h), es decir, la expresion en (3.94)). Utilice las
expresiones obtenidas en este caso para el nivel de agua para determinar
lo que sucede con la diferencia hd h(t), cuando t , conforme se
utilizan valores cada vez mayores de kp > 0. Use su experiencia cotidiana
para explicar por que sucede esto.
3. Considere el control proporcional-integral de nivel presentado en el ejem-
plo 3.17 (cuando se usa la expresion en (3.97)). Demuestre que existiran
170 3 Base matematica: ecuaciones diferenciales

oscilaciones en el nivel de agua si se utiliza un valor suficientemente grande


de ki > 0. Como puede explicar este fenomeno de acuerdo a su experien-
cia cotidiana?
4. Dada la siguiente ecuacion diferencial:

y + 127y + 570y = 3990u, y(0) = 0, y(0) = 0, u=1

encuentre los valores de , n y el parametro k introducido en la ecuacion


(3.40). Usando estos datos diga como esta expresada y(t).
5. Considere el sistema masa-resorte-amortiguador descrito en el ejemplo
3.6. La grafica mostrada en la figura 3.23 se obtiene cuando se aplica una
fuerza f =0.5[Nm] constante. Encuentre los valores de b, K y m.

x
[m]

t [s]

Figura 3.23. Posicion de la masa en un sistema masa-resorte-amortiguador cuando


se aplica una fuerza de entrada constante. La lnea punteada representa el valor final
de la posicion de la masa.

6. Considere las siguientes funciones de transferencia:

Y1 (s) = G1 (s)U (s), Y2 (s) = G2 (s)U (s)


ab b
G1 (s) = , G2 (s) = , a > 0, b > 0
(s + a)(s + b) s+b

donde U (s) = A/s, con A una constante. Realice simulaciones en las que
use valores de a que aumentan desde valores pequenos hasta valores muy
3.14 Ejercicios propuestos 171

grandes (respecto a b) y compare graficamente a y1 (t) e y2 (t). Explique lo


que observa.
7. De acuerdo a la seccion 3.1, se sabe que para cualquier condicion inicial
la siguiente ecuacion diferencial y + 7y = 2 tiene una solucion de la forma
y(t) = Ee7t + D donde E y D son algunas constantes que no interesa
calcular en este ejercicio. Encuentre del mismo modo la solucion para cada
una de las siguientes ecuaciones diferenciales.

y + 4y + y = 2
y + y + 10y = 3t
y + 7y = 2 sin(t)
y + 3y + 2y = 2et
y + 2y + 2y = 2 cos(2t) 4 sin(2t)
y 4y = 8t2 4
y (4) + 11y (3) + 28y = 10

8. Para las siguientes ecuaciones diferenciales diga cuanto vale lmt y(t).
Notese que el mismo resultado se obtiene sin importar el valor de las
condiciones iniciales.

y (3) + y 2y + y = 8
y + y 10y = cos(5t)
y + ay + by = kA, a > 0, b > 0, a, b, A, k son constantes

9. Diga cual de las soluciones de las siguientes ecuaciones diferenciales pre-


senta menor sobre paso y cual tiene un tiempo de subida mas corto.

3y + 3y + y6 = 2A
y + 4y + 10y = 9A

A es una constante.
10. Considere la solucion de una ecuacion diferencial de segundo orden ante
una entrada constante o tipo escalon, considerando condiciones iniciales
cero, presentada en (3.44). Obtenga los maximos de dicha respuesta y
resolviendo para el primero de dichos maximos demuestre que el sobre
paso se puede calcular como:


Mp ( %) = 100 e 1 2

Encuentre los instantes de tiempo en los cuales la respuesta natural es


cero y resolviendo para el primero de esos instantes demuestre que:
" p !#
1 1 2
tr = arctan
d
172 3 Base matematica: ecuaciones diferenciales

11. Considere las siguientes expresiones:


as + b d
Y (s) = U (s), Z(s) = U (s)
s2 + c s2 +c
donde U (s) = A/s con A, a, b, c, d constantes positivas. Exprese y(t) en
funcion de z(t).
12. Considere la siguiente funcion de transferencia:
c
G(s) = 2
s + bs + c
Que debe hacer con b y/o c para que el sistema responda mas rapido?,
Que debe hacer con b y/o c para que el sistema responda con menos
oscilaciones?
13. Considere la solucion y(t) de una ecuacion diferencial lineal de coeficientes
constantes de orden n arbitrario.
Si la excitacion o entrada es acotada, Cuales son las condiciones para
que y(t) sea acotada para todo tiempo? Es decir, para que y(t) no se
haga infinita.
Cuales son las condiciones para que, cuando el tiempo tiende a infi-
nito, la unica parte de y(t) que permanezca sea la llamada respuesta
forzada?
Suponga que la excitacion o entrada es cero. Diga cuales son las dife-
rentes posibilidades para el comportamiento de y(t) cuando el tiempo
crece y bajo que condiciones se presenta cada una de ellas.
Suponga que la excitacion o entrada es un polinomio del tiempo. De-
muestre que la solucion no puede tener un polinomio del tiempo de
grado mayor que el contenido en la excitacion o entrada si todas las
races del polinomio caracterstico de la ecuacion diferencial tienen
parte real negativa.
Suponga que la entrada o excitacion esta dada como la suma de muchas
funciones seno y coseno del tiempo, de diferentes frecuencias. Recor-
dando como es la respuesta ante una excitacion tipo seno o coseno
del tiempo y el principio de superposicion Puede explicar el resultado
fundamental de la respuesta de las ecuaciones diferenciales lineales que
dice ([6], pag. 389) si la excitacion es una funcion periodica cualquiera
de periodo T y si todas las races del polinomio caracterstico tienen
parte real negativa, entonces cuando t la solucion y(t) tambien
es una funcion periodica de periodo T aunque con una forma de onda
posiblemente diferente a la de la excitacion? (recuerde el concepto de
series de Fourier).
14. Verifique las siguientes igualdades:
5 5/3 5/3
i) = +
s2 + s 2 s+2 s1
2 1/3 2/3 1
ii) = + +
s(s + 2)(s 1) s+2 s1 s
3.14 Ejercicios propuestos 173

1 1/2 1/4 1/4


iii) = + +
s3 s2
s+1 (s 1) 2 s1 s+1
1 1 1/2 3/4 1/4
iv) = + + +
s4 s3 s2 + s s (s 1)2 s1 s+1
2 1 s
v) = + 2
s3 + 2s s s +2
3 1 1/3 1/9 1/9
vi) 4 3
= 3 + 2 + +
s 3s s s s s3
8 1/2 1/4 1/4
vii) = + +
s(s + 4)(s 4) s s+4 s4
8 1 1
viii) 2
= +
s 16 s4 s+4
4 2 1 s1
ix) = 2+ + 2
s4 + s3 + 2s2 s s s +s+2
4 2 2 1 s 1
x) = + + + 2
s5 + 3s4 + 4s3 + 4s2 + 3s (s + 1)3 (s + 1)2 s+1 s +1
2
3s + 3s 2 1 2 1
xi) = 2 + +
s3 + 2s2 s s s+2
s+2 2 3 1 3
xii) = 2+ + +
s2 (s + 1)2 s s (s + 1)2 s+1
15. Un horno de induccion consiste basicamente de un inductor (L) dentro
del cual se coloca un recipiente de material refractario que contiene una
cantidad de metal (conductor de la electricidad) a fundir. En serie al
inductor se conecta un capacitor (C) para corregir el factor de potencia. Al
circuito se le aplica un voltaje alterno de alta frecuencia (audiofrecuencia)
con lo cual se inducen corrientes de remolino (o de eddy) en el metal
contenido dentro del recipiente refractario, por lo que se produce calor y
el metal se funde.
El dispositivo constituye un circuito RLC en serie donde la resistencia (R)
es el equivalente de la resistencia electrica del metal a fundir. El voltaje
alterno de alta frecuencia que se aplica al circuito esta dado como una
onda cuadrada de valor u = E sign(i) donde i es la corriente electrica a
traves del circuito, E es una constante positiva y sign(i) = +1 si i 0 o
sign(i) = 1 si i < 0.
Considere que el valor inicial de la corriente electrica en el circuito es
cero. Demuestre que si el coeficiente de amortiguamiento del circuito
es menor que la unidad (0 < < 1) la corriente en el inductor pes cero
de manera periodica cada /d segundos, donde d = n 1 2 ,
1 R
n = LC y = 2L n
.
De acuerdo a u = E sign(i), el voltaje aplicado, u, cambia de valor
cada que i = 0. Considerando esto y un valor inicial vc (0) para el
voltaje en el capacitor, encuentre una expresion para el voltaje en el
capacitor que sea valida en el proximo instante en el que i = 0.
174 3 Base matematica: ecuaciones diferenciales

Proponga los valores numericos que desee para R, L y C (tales que


0 < < 1). Sabiendo que el voltaje en el capacitor y la corriente en el
inductor no son discontinuos cuando el valor de u cambia (Por que?),
use de manera iterativa (utilizando un programa de computadora) la
formula obtenida en el inciso anterior para calcular de manera numeri-
ca el voltaje en el capacitor despues de varios cambios en el valor de
u. Verifique que al crecer el tiempo el voltaje en el capacitor converge
a un valor constante cada que i = 0.
Simule el comportamiento del circuito RLC en serie cuando u =
E sign(i), para comprobar los resultados del inciso anterior.
16. De acuerdo al ejemplo 3.19, cuando la inductancia de armadura se consi-
dera despreciable, el modelo de un motor de CD esta dado como:
km
JR V
(s) = (s)
B km ke
s+ J + JRa

donde (s) y V (s) son las transformadas de Laplace de la velocidad del


motor y del voltaje aplicado en las terminales de armadura.
Suponga que el voltaje aplicado es cero y que la velocidad inicial es
diferente de cero. Notese que aplicar un voltaje igual a cero en las ter-
minales del motor equivale a poner en corto las terminales de armadura
y el voltaje inducido es diferente de cero si la velocidad es diferente de
cero. Dibuje la respuesta natural bajo estas condiciones. Como puede
hacer que la respuesta natural desaparezca mas rapido? Que pasa con
la corriente electrica? Puede explicar por que la respuesta natural dis-
minuye mas rapidamente si la resistencia de armadura tiende a cero?
Conoce lo que significa el termino frenado dinamico? Por que la
constante de tiempo depende directamente de la inercia?Que signifi-
ca esto desde el punto de vista de las Leyes de la Mecanica (Leyes de
Newton)? Por que la constante de tiempo depende inversamente de
la constante de fuerza contraelectromotriz?
Suponga que se aplica un voltaje diferente de cero a partir de una ve-
locidad inicial igual a cero. Dibuje la respuesta total del sistema. Por
que la velocidad final no depende de la inercia J? De una interpretacion
desde el punto de vista de la fsica.
Referencias

1. K. Ogata, Ingeniera de Control Moderna, 4a. edicion, Pearson Prentice-Hall,


Madrid, 2003.
2. E. Kreyszig, Matematicas avanzadas para ingeniera, Vol. 1, Limusa, Mexico,
1980.
3. C. Ray Wylie, Matematicas superiores para ingeniera, McGraw-Hill, 4a. Edi-
cion, Mexico, 1994.
4. M. R. Spiegel, Manual de formulas y tablas matematicas., McGraw-Hill, Serie
Schaum, Mexico, 2002.
5. I. Benitez Serrano, Analisis de redes electricas: Circuitos 1, Instituto Politecnico
Nacional, ESIME, Mexico, D.F., 1983.
6. C.-T. Chen, Linear system theory and design, Holt, Rinehart and Winston, New
York, 1984.
7. V. Hernandez Guzman, A new stability analysis method for DC to DC series
resonant converters, Computacion y Sistemas, vol. 11, no. 1, pp. 14-25, 2007.
8. R. Silva Ortigoza, Control de convertidores resonantes mediante planitud dife-
rencial: diseno y construccion, Tesis Maestra en Ciencias, CINVESTAV-IPN
(Zacatenco), Febrero (2002).
9. R. Oruganti y F.C. Lee, Resonant power processors, Part I-State plane analysis,
IEEE Trans. Industry Applications, vol. AI-21, no. 6, pp. 1453-1460, 1985.
10. R. Oruganti y F.C. Lee, Resonant power processors, Part II-Methods of control,
IEEE Trans. Industry Applications, vol. AI-21, no. 6, pp. 1461-1471, 1985.
11. W. H. Hayt y J. E. Kemmerly, Analisis de circuitos en ingeniera, McGraw-Hill,
Mexico, D.F., 1985.
12. V. Valkenburg, Analisis de redes, Limusa, Mexico, D.F., 1994.
13. J. Stewart, Calculo. Diferencial e integral, International Thomson Editores,
Mexico, D.F., 2003.
4
Criterios de estabilidad y error en estado
estacionario

!d + I q + vq
PI 1= M PI !
vd (dq) 1 PMSM
PI

Id dq
I d = 0
+ Iq

Los sistemas de control en lazo cerrado pueden ser complejos. En ellos, los
componentes del sistema de control se conectan entre s dando origen a los
diagramas de bloques. La manera de trabajar estos problemas es simplificando
los diagramas de bloques para obtener una unica funcion de transferencia de
lazo cerrado que representa al sistema completo. Una vez conseguido esto, se
puede determinar la estabilidad del sistema completo estudiando la ubicacion
de los polos de la funcion de transferencia de lazo cerrado. Este problema
puede ser complejo incluso para sistemas de segundo orden. Por esta razon,
se propone un metodo que determina la estabilidad simplemente analizando
los signos de los coeficientes del polinomio caracterstico. Para sistemas de
orden superior se utiliza el criterio de Routh. Por otro lado, el estudio del
error en estado estacionario permite determinar que tipo de controlador se
debe utilizar para conseguir que la respuesta forzada sea igual o muy parecida
a la entrada del sistema en lazo cerrado (o valor deseado a la salida).
178 4 Criterios de estabilidad y error

Objetivos del captulo

Dado un sistema en lazo cerrado, aprender a manipular el diagrama de


bloques correspondiente para obtener una funcion de transferencia equiva-
lente.
Identificar la regla de los signos para determinar la ubicacion de las races
de un polinomio, como un metodo sencillo que permite establecer la esta-
bilidad de sistemas de primero y segundo orden.
Identificar el criterio de estabilidad de Routh como el metodo que da con-
diciones necesarias y suficientes para determinar cuando un sistema de
orden arbitrario es estable.
Dado un sistema en lazo cerrado y a partir del estudio del error en estado
estacionario, conseguir que la respuesta forzada sea igual o muy parecida
a la entrada.
Un sistema de control general esta formado por varios componentes que
interactuan entre s: planta a controlar, controlador, sistemas de medicion, ac-
tuadores, etc. Por esta razon un sistema de control puede ser muy complejo. A
pesar de esto, cualquier sistema de control en lazo cerrado puede ser reducido
para ser representado por una sola funcion de transferencia la cual relacio-
na a la salida controlada con la referencia o salida deseada. Esta funcion de
transferencia de lazo cerrado puede ser estudiada como se hace en el captulo
3. En el presente captulo se presenta el concepto de diagramas de bloques
para indicar como esta constituido un sistema de control en lazo cerrado y se
presenta la manera de manipularlos para obtener la funcion de transferencia
de lazo cerrado.
Por otro lado, un sistema de control siempre se disena de modo que cumpla
tres requisitos: a) que sea estable, b) que tenga las caractersticas deseadas de
respuesta transitoria y c) que tenga las caractersticas deseadas de respuesta
en estado estacionario. De acuerdo a lo estudiado en el captulo 3, una funcion
de transferencia es estable si todos sus polos tienen parte real negativa. Sin
embargo, verificar este requisito de manera analtica puede presentar algunas
dificultades y por ello surge la necesidad de encontrar metodos sencillos para
conseguirlo. En este captulo se presentan dos alternativas: 1) la regla de los
signos para determinar la ubicacion de las races de un polinomio y, 2) el
Criterio de estabilidad de Routh.
Las caractersticas de respuesta transitoria de un sistema de control depen-
den de la ubicacion de los polos y de los ceros de la funcion de transferencia en
lazo cerrado. Hay dos metodos para el diseno de un controlador que asigne los
polos y los ceros de la funcion de transferencia de lazo cerrado en los lugares
requeridos para que se consigan las caractersticas deseadas de respuesta tran-
sitoria: el lugar de las races (captulo 5) y la respuesta en frecuencia (captulo
6).
Finalmente, las caractersticas deseadas de respuesta en estado estaciona-
rio se refieren al diseno de un controlador que consiga que, una vez que la
4.1 Diagramas de bloques 179

respuesta natural es cero1 , la respuesta del sistema en lazo cerrado alcance la


referencia o salida deseada de manera exacta o, al menos, dentro de ciertos
margenes de tolerancia. Esto se consigue si la respuesta forzada del sistema
en lazo cerrado es igual o muy cercana a la referencia o salida deseada. Este
tema tambien es estudiado en el presente captulo.

4.1. Diagramas de bloques


A continuacion se muestra, a base de ejemplos, como se puede manipular
un diagrama de bloques formado por la interconexion de varias funciones de
transferencia para ser simplificado y ser representado por una sola funcion de
transferencia. Tambien se muestra como se pueden simplificar los diagramas
de bloques correspondientes a sistemas que tienen dos (o mas) entradas.
Ejemplo 4.1 Suponga que se tienen dos sistemas tales que la entrada de uno
es la salida del otro (conectados en cascada), como se muestra en la figura
4.1. Entonces se puede escribir:

Y1 (s) = G1 (s)U1 (s), Y2 (s) = G2 (s)U2 (s), U1 (s) = Y2 (s)

para obtener:

Y1 (s) = G1 (s)G2 (s)U2 (s), G(s) = G1 (s)G2 (s)


Y1 (s) = G(s)U2 (s)

U 2(s) Y 1(s) U 2(s) Y 1(s)


G 2(s) G 1(s) ) G(s)

Figura 4.1. Sistemas conectados en cascada.

Esto significa que los sistemas conectados en cascada, como en la figura


4.1, pueden ser representados por una sola funcion de transferencia G(s) que
se calcula como el producto de las funciones de transferencia de los sistemas
en cascada. El lector puede verificar que esto es cierto sin importar el numero
de sistemas conectados en cascada.

Ejemplo 4.2 Suponga que se tienen dos sistemas conectados en paralelo co-
mo se muestra en la figura 4.2. Entonces se puede escribir:

Y1 (s) = G1 (s)U (s), Y2 (s) = G2 (s)U (s)


1
Cuando el tiempo es suficientemente grande, o en estado estacionario
180 4 Criterios de estabilidad y error

para obtener:
Y1 (s) + Y2 (s) = (G1 (s) + G2 (s))U (s) G(s) = G1 (s) + G2 (s)
Y1 (s) + Y2 (s) = G(s)U (s)

Y 1(s)
G 1(s)
U(s)
+
Y 1(s) + Y 2(s)
+
G 2(s)
Y 2(s)

U(s)
) G(s) Y 1(s) + Y 2(s)

Figura 4.2. Sistemas conectados en paralelo.

Esto significa que los sistemas conectados en paralelo, como en la figura


4.2, pueden ser representados por una sola funcion de transferencia G(s) que
se calcula como la suma de las funciones de transferencia de los sistemas
conectados en paralelo. El lector puede verificar que esto es cierto sin importar
el numero de sistemas conectados en paralelo.
Ejemplo 4.3 Considere el sistema de control en lazo cerrado mostrado en la
figura 4.3. Los bloques G(s) y H(s) representan las funciones de transferencia
de los diferentes componentes de un sistema de control. De hecho, G(s) y
H(s) pueden ser el resultado de combinar las funciones de transferencia de
varios componentes del sistema de control como se indica en los dos ejemplos
previos. De acuerdo a la definicion de funcion de transferencia, a partir de la
figura 4.3 se encuentra que:
C(s) = G(s)E(s), E(s) = R(s) Y (s), Y (s) = H(s)C(s)
Sustituyendo sucesivamente estas expresiones se encuentra que:
C(s) = G(s)[R(s) Y (s)]
= G(s)[R(s) H(s)C(s)]
= G(s)R(s) G(s)H(s)C(s)
C(s)[1 + G(s)H(s)] = G(s)R(s)
G(s)
C(s) = R(s)
1 + G(s)H(s)
4.1 Diagramas de bloques 181

donde:
C(s) G(s)
M (s) = = (4.1)
R(s) 1 + G(s)H(s)
se conoce como la funcion de transferencia de lazo cerrado.

R(s) + E(s) C(s)


G(s)

Y(s)
H(s)

Figura 4.3. Sistema en lazo cerrado.

Ejemplo 4.4 Considere el diagrama de bloques de la figura 4.4(a). Para redu-


cir este diagrama de bloques es conveniente recorrer el punto de resta colocado
a la derecha de U (s) hasta donde se encuentra I (s). Para conseguirlo es in-
dispensable que la variable I(s) en 4.4(a) permanezca sin alterarse. Es decir,
de acuerdo a la figura 4.4(a):
1
I(s) = [KAp (I (s) I(s)) nke s(s)]
Ls + R
Notese que esta expresion tambien es valida en el diagrama de bloques de la
figura 4.4(b) y, por tanto, este diagrama de bloques es equivalente al de la
figura 4.4(a). A continuacion, es claro que el lazo existente entre el segundo
punto de resta en 4.4(b) e I(s) es identico al sistema en lazo cerrado mostrado
en la figura 4.3 con:
KAp
G(s) = , H(s) = 1
Ls + R
donde se ha usado el resultado del ejemplo 4.1 para calcular la funcion de
transferencia de dos sistemas en cascada como el producto de las funciones de
transferencia de los sistemas en cascada. Por tanto, usando (4.1) se encuentra
que la siguiente funcion de transferencia debe ser colocada antes de I(s):
KAp
Ls + R + KAp
Esto se muestra en la figura 4.4(c). El diagrama de bloques en la figura 4.4(c)
tiene dos entradas. Para encontrar la salida (s) como funcion de las dos
entradas se usa el principio de superposicion (vease la seccion 3.10), es decir:

(s) = G1 (s)I (s) + G2 (s)Tp (s) (4.2)


182 4 Criterios de estabilidad y error
U i ( s) T p ( s)

I (s) + U ( s) 1 I(s) + 1 ( s)
K Ap nkm
+ Ls+R Js 2 +bs

nke s

(a)
T p ( s)
I (s) + (s)
+ 1 I(s) + 1
KAp nkm
Ls+R Js 2 +bs

nke
KA p
s

(b)
T p ( s)

I (s) + KA p I(s) + 1 (s)
nkm
Ls+R+KA p Js 2 +bs

nke
KA p
s

(c)

Figura 4.4. Simplificacion de un diagrama de bloques que contiene un lazo interno.

donde G1 (s) es la funcion de transferencia obtenida con I (s) como entrada y


(s) como salida cuando se considera que Tp (s) = 0 en el diagrama de bloques
en la figura 4.4(c), es decir, cuando el diagrama de bloques tiene la forma
mostrada en la figura 4.5(a). Por tanto, usando (4.1) se define:

G(s) (s)
M (s) = = = G1 (s)
1 + G(s)H(s) I (s)
con:
KAp nkm nke s
G(s) = , H(s) =
(Ls + R + KAp )(Js2 + bs) KAp
para obtener:
nkm
G1 (s) = h i (4.3)
sL+R n2 km ke
KAp + 1 (sJ + b) + KAp s
4.1 Diagramas de bloques 183

I(s) + (s)
KA p 1
Ls+R+KA p
nkm Js 2+bs

nk e
KA p
s
(a) Diagrama de bloques cuando Tp (s) = 0.

T p(s) 1
(s)
Js 2+bs

nk mKA p nk e
Ls+R+KA p KA p
s
(b) Diagrama de bloques cuando I (s) = 0.

I(s) G1(s)
+
(s)
+
T p(s) G2(s)
(c) Diagrama de bloques equivalente a cualquiera de los diagra-
mas mostrados en la figura 4.4.

Figura 4.5. Simplificacion del diagrama de bloques en la figura 4.4(c).

Por otro lado, G2 (s) es la funcion de transferencia obtenida con Tp (s) como
entrada y (s) como salida cuando se considera que I (s) = 0 en el diagrama
de bloques en la figura 4.4(c), es decir, cuando el diagrama de bloques tiene
la forma mostrada en la figura 4.5(b). Por tanto, usando (4.1) se define:
G(s) (s)
M (s) = = = G2 (s)
1 + G(s)H(s) Tp (s)
con:
1 n2 km ke s
G(s) = 2
, H(s) =
Js + bs Ls + R + KAp
para obtener:
184 4 Criterios de estabilidad y error

sL+R
KAp +1
G2 (s) = h i (4.4)
sL+R n2 km ke
KAp + 1 (sJ + b) + KAp s

Por tanto, cualquiera de los diagramas de bloques de las figuras 4.4(a), 4.4(b)
o 4.4(c) se puede representar como el diagrama de bloques de la figura 4.5(c)
con G1 (s) y G2 (s) dadas en (4.3) y (4.4).
Ejemplo 4.5 Considere el sistema en lazo cerrado mostrado en la figura
4.6(a). Este ejemplo representa un esquema de control conocido como contro-
lador con dos grados de libertad. Este es un sistema con dos entradas y una
salida. Por tanto, se puede proceder como en el ejemplo previo para, usando
el principio de superposicion, escribir:

C(s) = G1 (s)R(s) + G2 (s)D(s)

donde G1 (s) es la funcion de transferencia obtenida usando R(s) como entrada


y C(s) como salida cuando D(s) = 0, es decir, cuando se usa el diagrama de
bloques de la figura 4.6(b). Por otro lado, G2 (s) es la funcion de transferencia
obtenida usando D(s) como entrada y C(s) como salida cuando R(s) = 0, es
decir, cuando se usa el diagrama de bloques de la figura 4.6(c).
Primero se procede a obtener G1 (s). Para simplificar el diagrama de blo-
ques de la figura 4.6(b) notese que:

V (s) = Gc1 (s)(R(s) C(s)) Gc2 (s)C(s)


= Gc1 (s)(R(s) C(s)) + Gc2 (s)(R(s) C(s)) Gc2 (s)R(s)
= (Gc1 (s) + Gc2 (s))(R(s) C(s)) Gc2 (s)R(s)

Por lo que se obtienen, sucesivamente, los diagramas de bloques de las figu-


ras 4.7(a), 4.7(b) y 4.7(c). Notese que, de acuerdo al ejemplo 4.2, se puede
escribir:

Gc2 (s)
F (s) = 1 R(s)
Gc1 (s) + Gc2 (s)
Gc1 (s) + Gc2 (s) Gc2 (s)
= R(s)
Gc1 (s) + Gc2 (s)
Gc1 (s)
= R(s) (4.5)
Gc1 (s) + Gc2 (s)

Por otro lado, se puede hacer uso de (4.1) junto con:

G(s) = (Gc1 (s) + Gc2 (s))Gp (s), H(s) = 1

para obtener:
(Gc1 (s) + Gc2 (s))Gp (s)
C(s) = F (s) (4.6)
1 + (Gc1 (s) + Gc2 (s))Gp (s)
4.1 Diagramas de bloques 185

D(s)
R(s) + + C(s)
G c1 ( s)
+ + G p ( s)

G c2 ( s)

(a) Sistema en lazo cerrado.

R(s) + V(s) C(s)


G c1 ( s)
+ G p ( s)


G c2 ( s)

(b) Caso cuando D(s) = 0


D(s) + C(s)
G p ( s)


G c1 ( s)
+
+
G c2 ( s)
(c) Caso cuando R(s) = 0

Figura 4.6. Sistema de control con dos grados de libertad.

Sustituyendo (4.5) en (4.6) se obtiene:


Gc1 (s)Gp (s)
C(s) = R(s)
1 + (Gc1 (s) + Gc2 (s))Gp (s)
por lo que se concluye que:
Gc1 (s)Gp (s)
G1 (s) = (4.7)
1 + (Gc1 (s) + Gc2 (s))Gp (s)

Por otro lado, del diagrama de bloques de la figura 4.6(c) y de acuerdo al


ejemplo 4.2 se obtiene el diagrama de bloques de la figura 4.8. Usando (4.1)
junto con:

G(s) = Gp (s), H(s) = Gc1 (s) + Gc2 (s)


186 4 Criterios de estabilidad y error

G c2(s)

R(s) + V(s) C(s)


G c1(s) + G c2(s) G p ( s)
+

(a)
G c2(s)
G c1(s)+G c2(s) G c1(s) + G c2(s)

R(s) +
V(s) C(s)
G c1(s) + G c2(s) G p ( s)
+

(b)

G c2(s)
G c1(s)+G c2(s)

R(s)
F(s) V(s) C(s)
G c1(s) + G c2(s) G p ( s)
+
+
1

(c)

Figura 4.7. Simplificacion del diagrama de bloques mostrado en la figura 4.6(b).

se obtiene:
Gp (s)
C(s) = D(s)
1 + (Gc1 (s) + Gc2 (s))Gp (s)

es decir:
Gp (s)
G2 (s) = (4.8)
1 + (Gc1 (s) + Gc2 (s))Gp (s)

Por tanto, el diagrama de bloques de la figura 4.6(a) se puede representar


como el diagrama de bloques de la figura 4.9 con G1 (s) y G2 (s) dadas en
(4.7) y (4.8).
4.2 Regla de los signos 187

D(s) C(s)
+ G p ( s)


G c1(s) + G c2(s)

Figura 4.8. Simplificacion del diagrama de bloques en la figura 4.6(c).

R(s) G 1(s)
+ C(s)

+
D(s) G 2(s)

Figura 4.9. Diagrama de bloques equivalente al de la figura 4.6(a).

4.2. Regla de los signos para determinar la ubicacion


de las races de un polinomio
De acuerdo a la seccion 3.8, la estabilidad de una funcion de transferencia
esta asegurada si la parte real de todos sus polos es negativa, es decir si
todas las races de su polinomio caracterstico tienen parte real negativa. Sin
embargo, en ocasiones es difcil calcular el valor exacto de los polos, sobre
todo si el polinomio es de grado tres o mayor. La razon de esto es que el
procedimiento para calcular las races de polinomios de orden 3 y 4 es un poco
complicado. Mas aun, para polinomios de grado 5 o mayor ni siquiera existen
procedimientos analticos para esto. Incluso para polinomios de segundo grado
en ocasiones es un poco tedioso tener que hacer el calculo correspondiente aun
cuando la formula existente para tal caso es bien conocida. As que es muy
conveniente contar con un medio sencillo que permita determinar si los polos
de un polinomio tienen parte real negativa o si existe alguno con parte real
positiva. En esta seccion se introducen criterios sencillos que resuelven este
problema y que estan basados en el estudio de los signos de los coeficientes
de un polinomio.

4.2.1. Polinomios de segundo grado

Criterio 4.1 Si un polinomio de segundo grado tiene todos sus coeficientes


con el mismo signo, entonces todas sus races tienen parte real negativa.
Prueba. Considere el siguiente polinomio:

p(s) = s2 + cs + d
188 4 Criterios de estabilidad y error

donde c > 0, d > 0. Si todos los coeficientes de un polinomio tuvieran signo


negativo, entonces se puede factorizar dicho signo y proceder como se muestra
a continuacion. Las dos races de p(s) se obtienen usando la formula general:

c c2 4d
s1,2 = (4.9)
2
Caso i): c2 4d < 0.
En este caso ambas races son complejas conjugadas con parte real negativa
porque c > 0:

c 4d c2
s1,2 = j
2 2
Caso ii): c2 4d > 0.
En este caso

c2 > c2 4d > 0

porque d > 0. Aplicando la raz cuadrada en ambos lados de la desigualdad


se obtiene:
p
c > c2 4d

porque la raz cuadrada es una funcion estrictamente creciente. Entonces:


p
c c2 4d > 0

De acuerdo a (4.9), esto significa que ambas races son reales, distintas y
negativas en este caso:

c + c2 4d
s1 = <0
2
c c2 4d
s2 = <0
2
Caso iii): c2 4d = 0.
En este caso ambas races son reales, iguales y negativas:
c
s1,2 = (4.10)
2
Ejemplo 4.6 Notese que el polinomio s2 + s + 1 satisface el caso i) por lo que
sus races son complejas conjugadas con parte real negativa. De hecho, no es
difcil verificar que estas races son 0.5 + j0.866 y 0.5 j0.866. Por otro
lado, el polinomio s2 + 2.5s + 1 satisface el caso ii) por lo que sus dos races
son reales, distintas y negativas. No es difcil verificar que dichas races son
2 y 0.5. Finalmente, el polinomio s2 + 2s + 1 satisface el caso iii) por lo
que sus dos races son reales, iguales y negativas. No es difcil verificar que
dichas races son 1 y 1.
4.2 Regla de los signos 189

Criterio 4.2 Si un polinomio de segundo grado tiene algunos de sus coefi-


cientes con signo contrario al de los otros coeficientes, entonces al menos una
de sus races tiene parte real positiva.
Prueba. Considere el siguiente polinomio:

p(s) = s2 + cs + d

donde hay tres posibilidades:


1) c < 0, d > 0.
2) c > 0, d < 0.
3) c < 0, d < 0.
Las dos races correspondientes se obtienen usando la formula general:

c c2 4d
s1,2 = (4.11)
2
Caso i): c2 4d < 0.
En este caso ambas races son complejas conjugadas con parte real positiva
si se cumple 1). Los casos 2) y 3) no son posibles porque d < 0 implica
que c2 4d > 0.
Caso ii): c2 4d > 0.
Este caso es posible para d < 0, con c < 0 o c > 0 y algunos valores
pequenos de d > 0 con c < 0. Para valores mayores de d > 0 se recupera
el caso i). Si d < 0 entonces:

c2 < c2 4d

Aplicando la raz cuadrada en ambos lados de la desigualdad se obtiene:


p
abs(c) < c2 4d

porque la raz cuadrada es una funcion estrictamente creciente. Entonces:


p
abs(c) c2 4d < 0

Esto significa que ambas races son reales y distintas con una de ellas
positiva:

c + c2 4d
s1 = <0
2
c c2 4d
s2 = >0
2
Si d > 0 con c < 0 entonces:

c2 > c2 4d
190 4 Criterios de estabilidad y error

Aplicando la raz cuadrada en ambos lados de la desigualdad se obtiene:


p
abs(c) > c2 4d
p
abs(c) c2 4d > 0

Como c < 0, ya que d > 0, entonces hay dos races reales positivas:

c + c2 4d
s1 = >0
2
c c2 4d
s2 = >0
2
Caso iii): c2 4d = 0.
En este caso d = c2 /4 > 0, por lo que c < 0 (vease 1)). Esto implica que
ambas races son reales, iguales y positivas:
c
s1,2 = >0 (4.12)
2
Ejemplo 4.7 A continuacion se presentan varios polinomios de segundo or-
den y sus correspondientes races. Se deja como ejercicio para el lector que
verifique estos resultados, que identifique a que caso de los anteriores corres-
ponde cada uno y que compruebe que se cumplen las predicciones hechas en el
analisis arriba presentado.
s2 + 2s 1, races: 2.4142 y 0.4142.
s2 2.5s + 1, races: 2 y 0.5.
s2 s 1, races: 1.618 y 0.618.
s2 s + 1, races: 0.5 + j0.866 y 0.5 j0.866.
s2 2s + 1, races: 1 y 1.

4.2.2. Polinomios de primer grado

En este caso es muy facil demostrar que se cumple algo similar a los poli-
nomios de segundo grado:

Criterio 4.3 Si los dos coeficientes tienen el mismo signo entonces la unica
raz es real y negativa. Si un coeficiente tiene signo contrario al otro coeficiente
entonces la unica raz es real y positiva.

4.2.3. Polinomios de grado 3 o mayor

Criterio 4.4 Si al menos un coeficiente tiene signo contrario a los otros coefi-
cientes entonces es seguro que existe al menos una raz con parte real positiva.
4.3 Criterio de estabilidad de Routh 191

Prueba. Considere el siguiente polinomio donde n 3:


p(s) = sn + an1 sn1 + . . . + a1 s + a0 = (s p1 )(s p2 ) (s pn ()4.13)
Del estudio de polinomios de segundo grado se sabe que el producto (s
pi )(s pj ) = s2 + cs + d sera tal que c < 0 y/o d < 0 si una de las races
pi o pj o ambas tienen parte real positiva. Por otro lado, el polinomio de
primer orden (s pk ) tiene un coeficiente negativo si su raz pk es positiva.
Notese tambien que los coeficientes aj , j = 0, . . . , n 1 que se encuentran en
el lado izquierdo de (4.13) se obtienen como la suma de los productos de los
coeficientes de los polinomios de la forma s2 + cs + d y (s pk ) que existen en
el miembro de la derecha de (4.13). Entonces, la unica manera de que exista
un coeficiente aj < 0 en el lado izquierdo de (4.13) es que exista una raz con
parte real positiva en el miembro derecho de (4.13), es decir que alguno de los
polinomios s2 + cs + d o (s pk ) tenga un coeficiente negativo.
Criterio 4.5 Aun cuando todos los coeficientes tengan el mismo signo, no
puede asegurarse que todas las races tienen parte real negativa.
Esto puede explicarse usando los mismos argumentos del parrafo anterior,
recordando que el producto de dos coeficientes negativos da un resultado po-
sitivo. Entonces, aun cuando todos los coeficientes del polinomio en el lado
izquierdo de (4.13) sean positivos, existe la posibilidad de que dos coeficien-
tes negativos (races con parte real positiva) del lado derecho de (4.13) se
multipliquen para dar un coeficiente positivo del lado izquierdo de (4.13).
Ejemplo 4.8 Para ilustrar lo que sucede cuando un polinomio es de orden
mayor a 2, a continuacion se presentan algunos polinomios y sus races. El
lector puede comprobar estos resultados verificando que s3 + a2 s2 + a1 s + a0 =
(sp1 )(sp2 )(sp3 ) donde p1 , p2 , p3 son las races del polinomio en cuestion.
s3 + s2 + s + 1.5, races: 1.2041, 0.102 + j1.1115 y 0.102 j1.1115.
Dos races con parte real positiva, a pesar de que todos los coeficientes del
polinomio tienen el mismo signo.
s3 s2 + s + 1, races: 0.7718 + j1.1151, 0.7718 j1.1151 y 0.5437.
Dos races con parte real positiva porque un coeficiente del polinomio tiene
signo contrario a los otros coeficientes.
s3 + s2 + 1, races: 1.4656, 0.2328 + j0.7926, 0.2328 j0.7926. Dos races
con parte real positiva porque un coeficiente tiene valor cero, aunque los
demas coeficientes tienen el mismo signo.
s3 + s2 + 3s + 1, races: 0.3194 + j1.6332, 0.3194 j1.6332 y 0.3611.
Todas las races tienen parte real negativa y todos los coeficientes del poli-
nomio tienen el mismo signo.

4.3. Criterio de estabilidad de Routh


Como se ve en la seccion anterior, la regla de los signos para determinar
la ubicacion de las races de un polinomio, aunque muy comoda, tiene su
192 4 Criterios de estabilidad y error

principal desventaja cuando se trata de aplicar a polinomios de grado mayor


o igual a 3: si todos los coeficientes de dicho polinomio tienen el mismo signo
nada se puede asegurar a cerca del signo de la parte real de sus races. La
solucion a este problema la da el criterio de estabilidad de Routh el cual,
dado un polinomio de grado arbitrario, establece condiciones necesarias y
suficientes para asegurar que todas las races tienen parte real negativa.

Tabla 4.1. Tabla que se debe construir para aplicar el criterio de Routh.
sn an an2 an4 an6 ... 0
n1
s an1 an3 an5 an7 ... 0
sn2 b1 b2 b3 b4 ... 0
sn3 c1 c2 c3 c4 ... 0
sn4 d1 d2 d3 d4 ... 0
.. .. .. .. ..
. . . . . ... 0
s2 p1 p2 0
s1 q1 0
s0 p2

Dado un polinomio arbitrario, ordenelo en orden descendente de potencias:


an sn + an1 sn1 + + a1 s + a0 (4.14)
El criterio de estabilidad de Routh consiste en realizar los siguientes dos pasos:
1. Construya la tabla 4.1. Notese que los primeros dos renglones de la tabla
anterior se construyen usando directamente los coeficientes del polinomio
bajo estudio. Observe tambien que los ultimos elementos de los dos pri-
meros renglones terminan en ceros, pues ese es el valor de los coeficientes
de las potencias que no aparecen en el polinomio en (4.14). Los elementos
de los otros renglones se calculan de acuerdo a las siguientes reglas:
an1 an2 an an3 an1 an4 an an5
b1 = , b2 = ,
an1 an1
an1 an6 an an7
b3 =
an1
..
.
b1 an3 an1 b2 b1 an5 an1 b3 b1 an7 an1 b4
c1 = , c2 = , c3 =
b1 b1 b1
..
.
c1 b2 b1 c2 c1 b3 b1 c3 c1 b4 b1 c4
d1 = , d2 = , d3 =
c1 c1 c1
..
.
4.3 Criterio de estabilidad de Routh 193

Notese que, de acuerdo a estas reglas, el ultimo elemento de cada renglon


es cero y que la tabla tiene una forma triangular.
2. Analice unicamente la primera columna de la tabla construida. El numero
de cambios de signos al recorrer de arriba hacia abajo los elementos de la
primera columna es igual al numero de races con parte real positiva.
A continuacion se presentan varios ejemplos.
Ejemplo 4.9 Sea el siguiente polinomio de segundo orden:

s2 + as + b

con a y b dos constantes reales. Dado que este polinomio es de segundo grado
(tiene dos races) entonces se puede usar la regla de los signos vista en la
seccion 4.2 para concluir que las dos races tiene parte real negativa si

a > 0, b>0

ya que el coeficiente de s2 es positivo e igual a uno. Ahora se hara uso del


criterio de Routh para verificar este resultado. De acuerdo a las reglas del
criterio de Routh se construye la tabla 4.2. El criterio de Routh establece
que el numero de cambios de signo al recorrer los elementos de la primera
columna es igual al numero de races con parte real positiva. Por tanto, si
no hay cambios de signo entonces las dos races tendran parte real negativa.
Como el primer elemento de la primera columna es igual a 1, el cual es un
numero positivo, entonces las condiciones:

a > 0, b>0

deben cumplirse simultaneamente para asegurar que ambas races tienen parte
real negativa. De este modo, el criterio de Routh y la regla de los signos de la
seccion 4.2 dan el mismo resultado, como se esperaba.

Tabla 4.2. Aplicacion del criterio de Routh al polinomio s2 + as + b.


s2 1 b 0
s1 a 0
s0 b

Ejemplo 4.10 Sea el siguiente polinomio:

s3 + 5s2 + 2s 8

Dado que existe un coeficiente de signo contrario al de los otros (8) se puede
usar la regla de los signos vista en la seccion 4.2 para concluir que existe al
menos una raz con parte real positiva. Ahora se hara uso del criterio de Routh
194 4 Criterios de estabilidad y error

para verificar este resultado. De acuerdo a las reglas del criterio de Routh se
construye la tabla 4.3. El criterio de Routh establece que el numero de cambios
de signo al recorrer los elementos de la primera columna es igual al numero
de races con parte real positiva. Por tanto, se concluye que el polinomio s3 +
5s2 + 2s 8 tiene una raz con parte real positiva. De hecho, usando software
especializado se pueden usar metodos numericos para encontrar que:
s = 2, s = 1, s = 4
son las races del polinomio en cuestion.

Tabla 4.3. Aplicacion del criterio de Routh al polinomio s3 + 5s2 + 2s 8.


s3 1 2 0
s2 5 -8 0
521(8)
s1 5
= 3.6 0
s0 8

Ejemplo 4.11 Sea el siguiente polinomio:


s3 + 1.8s2 + 0.61s + 2.02
Notese que todos los coeficientes del polinomio tienen el mismo signo (todos
son positivos). En este caso la regla de los signos vista en la seccion 4.2 no es
de utilidad porque el polinomio es de tercer grado. En este tipo de situaciones
el criterio de Routh es de gran utilidad. De acuerdo a las reglas del criterio de
Routh se construye la tabla 4.4. El criterio de Routh establece que el numero
de cambios de signo al recorrer los elementos de la primera columna es igual
al numero de races con parte real positiva. Por tanto, se concluye que el
polinomio s3 + 1.8s2 + 0.61s + 2.02 tiene dos races con parte real positiva. De
hecho, usando software especializado se pueden usar metodos numericos para
encontrar que:
s = 2, s = 0.1 + j, s = 0.1 j
son las races del polinomio en cuestion.

Tabla 4.4. Aplicacion del criterio de Routh al polinomio s3 + 1.8s2 + 0.61s + 2.02.
s3 1 0.61 0
s2 1.8 2.02 0
s1 1.80.6112.02
1.8
= 0.512 0
s0 2.02
4.3 Criterio de estabilidad de Routh 195

Ejemplo 4.12 Sea el siguiente polinomio:

s3 + as2 + bs + c

donde a, b y c son constantes reales desconocidas. Este tipo de situaciones es


muy comun en sistemas de control donde los coeficientes del polinomio carac-
terstico dependen de las ganancias del controlador, las cuales no se conocen
de antemano y deben ser determinadas de modo que se asegure la estabilidad
en lazo cerrado. Esto se consigue asegurando que todas las races del polino-
mio caracterstico de lazo cerrado tengan parte real negativa. Sin embargo, el
calculo de las races de un polinomio de tercer orden usando formulas analti-
cas es un proceso tedioso y, por tanto, esa no es una solucion practica. Este
es otro tipo de problema en el que el criterio de Routh es de gran utilidad.
De acuerdo a las reglas del criterio de Routh se construye la tabla 4.5. El
criterio de Routh establece que el numero de cambios de signo al recorrer los
elementos de la primera columna es igual al numero de races con parte real
positiva. Por tanto, como el primer elemento de la columna es igual a 1, es
decir es positivo, entonces si:
ab c
a > 0, >0 c>0 (4.15)
a
se asegura que las tres races tiene parte real negativa. Notese que las condi-
ciones en (4.15) son equivalentes a:
c
a > 0, b> >0 c>0
a
Esto indica que aunque a los coeficientes a y c solo se les exige que deben ser
positivos, en el caso del coeficiente b esto no es suficiente y se le exige un poco
mas: b > ac > 0.

Tabla 4.5. Aplicacion del criterio de Routh al polinomio s3 + as2 + bs + c.


s3 1 b0
s2 a c0
s1 ab1c
a
0
s0 c

Ejemplo 4.13 (Caso especial. Solo el elemento de la primera colum-


na de un renglon es igual a cero) Sea el siguiente polinomio:

s5 + 2s4 + 3s3 + 6s2 + 5s + 3

De acuerdo a las reglas del criterio de Routh se construye la tabla 4.6. Sin
embargo, la construccion de la tabla se detiene en el renglon correspondiente a
196 4 Criterios de estabilidad y error

s3 porque el elemento de la primera columna de ese renglon es cero. Esto trae


como consecuencia algunas divisiones entre cero al continuar construyendo los
siguientes renglones. Se recomienda sustituir el cero de la primera columna
por un valor > 0 pequeno pero positivo y continuar construyendo la tabla
como se muestra en la tabla 4.7.

Tabla 4.6. Aplicacion del criterio de Routh al polinomio s5 +2s4 +3s3 +6s2 +5s+3.
s5 1 3 5
s4 2 6 3
s3 2316
2
=0 2513
2
= 3.5 0
s2
s1
s0

Tabla 4.7. Aplicacion del criterio de Routh al polinomio s5 +2s4 +3s3 +6s2 +5s+3
(continuacion).
s5 1 3 5
s4 2 6 3
s3 3.5 0
s2 623.5 320

=30
424962
s1 1214
0
s0 3

Ahora determnese el numero de cambios de signo en la primera columna


conforme > 0 tiende a cero. Notese que en el caso de este ejemplo hay dos
cambios de signo. Esto significa que el polinomio bajo estudio tiene dos races
con parte real positiva. De hecho, se puede usar software especializado para
encontrar, usando metodos numericos, que las races del polinomio s5 + 2s4 +
3s3 + 6s2 + 5s + 3 son:

s = 0.3429 + j1.5083, s = 0.3429 j1.5083, s = 1.6681,


s = 0.5088 + j0.7020, s = 0.5088 j0.7020

Si al considerar > 0 no hubiera cambios de signo al recorrer la primera


columna entonces el sistema es marginalmente estable, es decir, hay races
sobre el eje imaginario.
Ejemplo 4.14 (Caso especial. Un renglon esta formado por ceros
exclusivamente o un renglon esta formado por un solo elemento el
cual, ademas, es cero) Sea el siguiente polinomio:
4.3 Criterio de estabilidad de Routh 197

s3 + 3s2 + s + 3
De acuerdo a las reglas del criterio de Routh se construye la tabla 4.8. Sin
embargo, la construccion de la tabla se detiene en el renglon correspondien-
te a s1 porque todo ese renglon esta formado exclusivamente por ceros. Este
es un caso especial que indica la existencia de races: 1) simetricas y reales,
2) simetricas e imaginarias, o 3) 4 races colocadas sobre los vertices de un
rectangulo centrado en el origen. Para continuar con el metodo se debe for-
mar un polinomio con los elementos del renglon inmediato superior al renglon
formado exclusivamente por ceros:
P (s) = 3s2 + 3,
se obtiene su derivada:
dP (s)
= 6s
ds
y se sustituyen estos coeficientes en el renglon formado exclusivamente por
ceros, como se muestra en la tabla 4.9, para continuar construyendo la tabla.

Tabla 4.8. Aplicacion del criterio de Routh al polinomio s3 + 3s2 + s + 3.


s3 1 10
s2 3 30
s1 3113
3
=00
s0

Tabla 4.9. Aplicacion del criterio de Routh al polinomio s3 + 3s2 + s + 3 (conti-


nuacion).
s3 110
s2 330
s1 60
s0 3

Como no hay cambios de signo al recorrer los elementos de la primera


columna se concluye que no hay races con parte real positiva y se concluye,
por tanto, que de los tres casos mencionados anteriormente solo es posible el
caso 2): hay races simetricas e imaginarias. Es mas, un aspecto importante
en este caso especial es el siguiente:
Con los elementos del renglon inmediato superior al renglon formado ex-
clusivamente por ceros forme un polinomio. Las races de dicho polinomio
tambien son races del polinomio original.
198 4 Criterios de estabilidad y error

Esto significa que las races del polinomio 3s2 + 3 tambien son races del
polinomio s3 + 3s2 + s + 3. Estas races se pueden obtener como:
3s2 + 3 = 0, s = j
Por tanto, el polinomio s3 + 3s2 + s + 3 tiene una raz en s = j y otra en
s = j. De hecho, se puede usar software especializado para encontrar, usando
metodos numericos, que las races del polinomio s3 + 3s2 + s + 3 son:
s = 3, s = j, s = j
Ejemplo 4.15 (Caso especial. Un renglon esta formado por ceros
exclusivamente o un renglon esta formado por un solo elemento el
cual, ademas, es cero) Sea el siguiente polinomio:
s4 + s2 + 1
De acuerdo a las reglas del criterio de Routh se construye la tabla 4.10. Como
hay un renglon formado exclusivamente por ceros se procede como en el ejem-
plo anterior. El polinomio formado con los elementos del renglon inmediato
superior (igual al polinomio original en este caso) es derivado respecto a s:
dP (s)
P (s) = s4 + s2 + 1, = 4s3 + 2s
ds

Tabla 4.10. Aplicacion del criterio de Routh al polinomio s4 + s2 + 1.


s4 1 1 1 0
s3 0 0 0
s2
s1
s0

Tabla 4.11. Aplicacion del criterio de Routh al polinomio s4 +s2 +1 (continuacion).


s4 1 1 10
s3 4 2 0
s2 4112
4
= 0.5 4110
4
=1
s1 0.5241
0.5
= 1.5 0
s0 1

Los coeficientes del polinomio resultante se sustituyen en el renglon for-


mado exclusivamente por ceros y se continua con la construccion de la tabla
4.3 Criterio de estabilidad de Routh 199

como se muestra en la tabla 4.11. Como hay dos cambios de signo al recorrer
la primera columna de la tabla 4.11 se concluye que existen dos races con
parte real positiva. Esto significa que es posible uno de los siguientes casos:
hay races simetricas y reales, o hay 4 races colocadas sobre los vertices de
un rectangulo centrado en el origen. De hecho, se puede hacer uso de softwa-
re especializado para encontrar, usando metodos numericos que las races del
polinomio s4 + s2 + 1 son:

s = 0.5 j0.8660, s = 0.5 j0.8660

es decir, hay 4 races colocadas sobre los vertices de un rectangulo centrado


en el origen.
Ejemplo 4.16 (Races repetidas sobre el eje imaginario) Cuando el
polinomio caracterstico tiene races repetidas sobre el eje imaginario la fun-
cion de transferencia es inestable. Sin embargo, este tipo de inestabilidad no
es detectado por el metodo del criterio de Routh. Por ejemplo, suponga que el
siguiente es el polinomio caracterstico de una funcion de transferencia:

s4 + 2s2 + 1 = [(s + j)(s j)]2

Notese que hay dos races repetidas sobre el eje imaginario. De acuerdo a las
reglas del criterio de Routh se construye la tabla 4.12. Como hay un renglon
formado exclusivamente por ceros se obtiene la derivada del siguiente polino-
mio:
dP (s)
P (s) = s4 + 2s2 + 1, = 4s3 + 4s
ds
y se continua con el metodo como se muestra en la tabla 4.13.

Tabla 4.12. Aplicacion del criterio de Routh al polinomio s4 + 2s2 + 1.


s4 1 2 1 0
s3 0 0 0
s2
s1
s0

Como hay otro renglon formado exclusivamente por ceros se obtiene la


derivada del siguiente polinomio:
dP1 (s)
P1 (s) = s2 + 1, = 2s
ds
y se continua con el metodo como se muestra en la tabla 4.14. Notese que
no hay cambios de signo en la primera columna de la tabla 4.14 por lo que
200 4 Criterios de estabilidad y error

Tabla 4.13. Aplicacion del criterio de Routh al polinomio s4 +2s2 +1 (continuacion).


s4 1 2 10
s3 4 4 0
s2 4241
4
=1 4110
4
=10
s1 0 0
s0

Tabla 4.14. Aplicacion del criterio de Routh al polinomio s4 +2s2 +1 (continuacion).


s4 1 210
s3 4 40
s2 1 10
s1 2 0
s0 1

el metodo indica, correctamente, que no hay races con parte real positiva.
Ademas, las races del polinomio P1 (s) = s2 + 1 son s = j, por lo que se
concluye estabilidad marginal. Notese que esto es incorrecto porque el poli-
nomio s4 + 2s2 + 1 tiene dos races imaginarias repetidas dos veces, lo cual
implica inestabilidad. As que debe tenerse cuidado con estos casos.

4.4. Error en estado estacionario

Se ha visto que la solucion de una ecuacion diferencial siempre esta dada


como la suma de la respuesta natural y la respuesta forzada. Si la ecuacion
diferencial es estable o, equivalentemente, si la funcion de transferencia es es-
table entonces la respuesta natural desaparece al crecer el tiempo y la solucion
alcanza la respuesta forzada. Recuerdese que la respuesta forzada depende de
(o es similar a) la entrada aplicada a la ecuacion diferencial. De acuerdo a
este razonamiento, en un sistema de control en lazo cerrado se procede del
siguiente modo. 1) La entrada del sistema en lazo cerrado es una senal que
representa el valor que se desea alcance la salida del sistema en lazo cerrado.
Por esto, a dicha senal de entrada se le conoce como la referencia o la salida
deseada. 2) El controlador se disena de manera que el sistema en lazo cerrado
sea estable y que la respuesta forzada del sistema en lazo cerrado sea igual o
muy cercana a la referencia o salida deseada.
En esta seccion se estudian las propiedades que debe tener un sistema de
control en lazo cerrado para que la respuesta forzada del sistema realimentado
sea igual o muy cercana a la entrada del sistema en lazo cerrado, es decir a la
referencia o salida deseada. Notese que esto equivale a conseguir que la senal
de error, definida como la diferencia entre la salida del sistema y la referencia
o salida deseada, sea cero o muy cercana a cero en estado estacionario, es
4.4 Error en estado estacionario 201

decir, cuando el tiempo es muy grande. Por esta razon, en lo que sigue se
estudia el comportamiento del error en estado estacionario.
Considere el sistema en lazo cerrado con realimentacion unitaria mostrado
en la figura 4.10. Como se muestra en esta seccion, un concepto fundamental
para la determinacion del error en estado estacionario es el tipo del sistema,
el cual se define a continuacion. Una funcion de transferencia de lazo abierto
de orden n siempre se puede escribir del siguiente modo:
k(s z1 )(s z2 ) (s zm )
G(s) =
sN (s p1 )(s p2 ) (s pnN )
donde n es el numero de polos de lazo abierto y m es el numero de ceros de
lazo abierto con n > m, zj 6= 0, j = 1, . . . , m y pi 6= 0, i = 1, . . . , n N .
De este modo, N es el numero de polos que la funcion de transferencia de
lazo abierto tiene en el origen (una vez cancelados los ceros que la funcion de
transferencia de lazo abierto pueda tener en el origen). Por definicion, el tipo
del sistema es igual a N , es decir, es el numero de integradores que el sistema
tiene en lazo abierto.
Por otro lado, la senal de error esta dada como la diferencia entre la salida
del sistema realimentado y la referencia o salida deseada:

E(s) = R(s) C(s) C(s) = R(s) E(s)

y por otro lado:

C(s) = G(s)E(s) = R(s) E(s)

de donde se encuentra que:

R(s) + E(s) C(s)


G(s)

Figura 4.10. Sistema en lazo cerrado con realimentacion unitaria.

E(s)[1 + G(s)] = R(s)


1
E(s) = R(s) (4.16)
1 + G(s)
El error en estado estacionario ess se obtiene usando (4.16) y el teorema del
valor final presentado en (3.3), es decir:
s
ess = lm e(t) = lm sE(s) = lm R(s) (4.17)
t s0 s0 1 + G(s)
202 4 Criterios de estabilidad y error

Como el error en estado estacionario es la diferencia entre la salida del siste-


ma c(t) y la referencia o salida deseada r(t), en estado estacionario, es logico
que en la expresion anterior ess dependa de la referencia R(s). Por tanto, para
continuar con el estudio es necesario conocer el valor de R(s) lo cual motiva la
definicion de senales de prueba. Una senal de prueba debe ser una funcion del
tiempo con dos caractersticas: 1) que tenga un significado fsico de importan-
cia en aplicaciones reales y 2) que sea sencilla de manejar matematicamente.
A continuacion se definen algunas de las senales (o entradas) de prueba mas
comunes en control clasico.
Considere el problema del control de la posicion de un canon antiaereo.
En este problema se desea que el canon apunte todo el tiempo hacia un avion
que se mueve a gran velocidad. Algunas situaciones que pueden presentarse
son las siguientes.
Entrada de prueba escalon. Suponga que el avion se dirige directa-
mente hacia el canon sobre una direccion de valor constante A. Si el canon
inicialmente apunta hacia una direccion diferente (cero) a donde se en-
cuentra el avion, entonces la referencia o la direccion en la que se desea
apunte el canon tiene la forma mostrada en la figura 4.11. Esta senal se
conoce como escalon y representa un cambio muy rapido (discontinuo) en
la direccion en que se desea apunte el canon. Entonces el canon debe mo-
verse rapidamente para que la direccion en que realmente apunta alcance
la direccion deseada, mostrada en la figura 4.11. Mas aun, se desea que en
estado estacionario la diferencia entre estas senales sea cero o al menos,
en el peor de los casos, muy cercana a cero. Si r(t) es un escalon:

0, t < 0
r(t) =
A, t 0

donde A es una constante, entonces R(s) = L{r(t)} = As es una funcion


suficientemente sencilla para ser manejada matematicamente.

r(t)

0 t
Figura 4.11. Entrada de prueba escalon.

Entrada de prueba rampa. Suponga que el avion pasa enfrente del


canon con velocidad constante A, dirigiendose hacia otro punto, y que
4.4 Error en estado estacionario 203

inicialmente el canon esta apuntando hacia el avion (en cero). Entonces la


referencia o la direccion en la que se desea apunte el canon tiene la forma
mostrada en la figura 4.12. Esta senal se conoce como rampa e indica
que se desea que la direccion en la que apunta el canon cambie con una
velocidad constante A (la velocidad del avion). Si r(t) es una rampa:

0, t < 0
r(t) =
At, t 0

donde A = dr(t)dt es una constante que representa la velocidad con que


r(t) cambia, entonces R(s) = L{r(t)} = sA2 es una funcion suficientemente
sencilla para ser manejada matematicamente.

r(t)

0 t
Figura 4.12. Entrada de prueba rampa.

Entrada de prueba parabola. Suponga que ahora el avion pasa enfrente


del canon con aceleracion constante A (tratando de escapar), dirigiendose
hacia otro punto, y que inicialmente el canon esta apuntando hacia el avion
(en cero). Entonces la referencia o la direccion en la que se desea apunte
el canon tiene la forma mostrada en la figura 4.13. Esta senal se conoce
como parabola e indica que se desea que la direccion en la que apunta el
canon cambie con una aceleracion constante A (la aceleracion del avion).
Si r(t) es una parabola:

0, t<0
r(t) = 1 2
2 At , t0
2
donde A = d dtr(t)
2 es una constante que representa la aceleracion con que
r(t) cambia, entonces R(s) = L{r(t)} = sA3 es una funcion suficientemente
sencilla para ser manejada matematicamente.
Como cualquiera de las tres situaciones anteriores puede aparecer durante
el funcionamiento del sistema de control de posicion del canon antiaereo, el
diseno del controlador debe ser tal que el error de estado estacionario sea cero
o muy pequeno ante cualquiera de las tres senales de prueba. A continuacion
se determinan las condiciones que permiten conseguir estas especificaciones
para cada senal de prueba.
204 4 Criterios de estabilidad y error

r(t)
1
2
At2

0 t
Figura 4.13. Entrada de prueba parabola.

4.4.1. Referencia tipo escalon

Suponga que R(s) = A/s es un escalon de altura A. Usando la expresion


en (4.17) se obtiene:

s A
ess = lm
s0 1 + G(s) s
A
= , kp = lm G(s)
1 + kp s0

donde kp se conoce como la constante de error estatica de posicion y su va-


lor esta directamente relacionado con el tipo del sistema. Por esta razon se
consideran los siguientes casos:
Sistemas tipo 0 (N = 0). En este caso la funcion de transferencia de lazo
abierto tiene la forma:
k(s z1 )(s z2 ) (s zm )
G(s) =
(s p1 )(s p2 ) (s pn )

por lo que:

k(z1 )(z2 ) (zm )


kp = lm G(s) =
s0 (p1 )(p2 ) (pn )

kp es finito. Esto significa que el error en estado estacionario es diferente


de cero:
A
ess = 6= 0
1 + kp

Sistemas tipo mayor o igual a 1 (N 1). En este caso la funcion de


transferencia de lazo abierto tiene la forma:
k(s z1 )(s z2 ) (s zm )
G(s) =
sN (s p1 )(s p2 ) (s pnN )

por lo que:
4.4 Error en estado estacionario 205

k(z1 )(z2 ) (zm )


kp = lm G(s) =
s0 sN (p1 )(p2 ) (pnN )

Esto significa que el error en estado estacionario es igual a cero:


A
ess = =0
1 + kp

4.4.2. Referencia tipo rampa

Suponga que R(s) = A/s2 es una rampa de pendiente A. Usando la ex-


presion en (4.17) se obtiene:

s A
ess = lm
s0 1 + G(s) s2
A
= , kv = lm sG(s)
kv s0

donde kv se conoce como la constante de error estatica de velocidad y su


valor esta directamente relacionado con el tipo del sistema. Por esta razon se
consideran los siguientes casos:
Sistemas tipo 0 (N = 0). En este caso la funcion de transferencia de lazo
abierto tiene la forma:
k(s z1 )(s z2 ) (s zm )
G(s) =
(s p1 )(s p2 ) (s pn )

por lo que:

k(z1 )(z2 ) (zm )


kv = lm sG(s) = (0) =0
s0 (p1 )(p2 ) (pn )

Esto significa que el error en estado estacionario crece sin lmite (tiende a
infinito):

A
ess =
kv
Sistemas tipo igual a 1 (N = 1). En este caso la funcion de transferencia
de lazo abierto tiene la forma:
k(s z1 )(s z2 ) (s zm )
G(s) =
s(s p1 )(s p2 ) (s pn1 )

por lo que:

k(z1 )(z2 ) (zm )


kv = lm sG(s) =
s0 (p1 )(p2 ) (pn1 )
206 4 Criterios de estabilidad y error

kv es un numero diferente de cero y finito. Esto significa que el error en


estado estacionario es diferente de cero:
A
ess = 6= 0
kv
Sistemas tipo mayor o igual a 2 (N 2). En este caso la funcion de
transferencia de lazo abierto tiene la forma:
k(s z1 )(s z2 ) (s zm )
G(s) =
sN (s p1 )(s p2 ) (s pnN )
por lo que:
k(z1 )(z2 ) (zm )
kv = lm sG(s) = N 1

s0 s (p1 )(p2 ) (pnN )
porque N 1 1. Esto significa que el error en estado estacionario es
igual a cero:
A
ess = =0
kv

4.4.3. Referencia tipo parabola

Suponga que R(s) = A/s3 es una parabola con segunda derivada igual a
A. Usando la expresion en (4.17) se obtiene:
s A
ess = lm
s0 1 + G(s) s3
A
= , ka = lm s2 G(s)
ka s0

donde ka se conoce como la constante de error estatica de aceleracion y su


valor esta directamente relacionado con el tipo del sistema. La funcion de
transferencia de lazo abierto tiene la forma:
k(s z1 )(s z2 ) (s zm )
G(s) =
sN (s p1 )(s p2 ) (s pnN )
por lo que:
k(z1 )(z2 ) (zm )
ka = lm s2 G(s) =
s0 sN 2 (p1 )(p2 ) (pnN )
Esto significa que:
El error en estado estacionario crece sin lmite (tiende a infinito) para
sistemas tipo menor o igual a 1:
A
ess = , N 1
kv
4.4 Error en estado estacionario 207

El error en estado estacionario es diferente de cero para sistemas tipo igual


a 2:
A
ess = 6= 0, N =2
kv
El error en estado estacionario es igual a cero para sistemas tipo mayor o
igual a 3:
A
ess = = 0, N 3
kv
Notese que, para las tres referencias o senales de prueba consideradas, el
error en estado estacionario se hace cero si se incrementa convenientemente el
numero de integradores que tiene la funcion de transferencia de lazo abierto
(tipo del sistema). Esto explica porque algunos controladores incluyen un
integrador (vease la seccion 5.2.4 donde se estudia el controlador PI). Por
otro lado, es muy importante subrayar que los resultados que se acaban de
presentar solo se cumplen si se asegura que el sistema en lazo cerrado es
estable ya que los resultados anteriores se han obtenido suponiendo que la
respuesta natural tiende a cero conforme el tiempo crece. Mas adelante, en los
captulos 5 y 6, se explica que el adicionar polos de lazo abierto (integradores,
cuando dichos polos estan en s = 0) tiende a hacer inestable al sistema en lazo
cerrado. As que no siempre sera posible, o conveniente, disenar un sistema
de control con error en estado estacionario igual a cero y se debera conformar
con un error en estado estacionario pequeno.
Finalmente, y por razones didacticas, en la figura 4.14 se muestra grafica-
mente el comportamiento de la salida c(t) con respecto a la referencia r(t),
cuando esta es una rampa, para los distintos tipos de sistema.

r(t)
e ss6=0
e ss = 0 c(t)

e ss ! 1

0 t
Figura 4.14. Comportamiento de la salida c(t) cuando la referencia r(t) es una
rampa. Notese que ess = 0 cuando el tipo es mayor o igual a 2, ess 6= 0 cuando el
tipo es igual a 1 y ess cuando el tipo es igual a 0.

Ejemplo 4.17 En la figura 4.15 se muestra un sistema de control de veloci-


dad de un motor de CD (vease el captulo 9). El modelo del motor esta dado
208 4 Criterios de estabilidad y error

k
por la funcion de transferencia Gm (s) = s+a , con k > 0 y a > 0, mientras que
la constante positiva kp representa la funcion de transferencia de un controla-
dor proporcional. Esto significa que la corriente usada como senal de control
se calcula como:

i = kp (d )

donde es la velocidad medida, d es la velocidad deseada e I (s) es la


transformada de Laplace de i . La funcion de transferencia de lazo abierto es:
kp k
G(s)H(s) =
s+a
Notese que al ser a > 0 este sistema es tipo 0 porque la funcion de transferen-
cia de lazo abierto no tiene ningun polo en el origen (en s = 0). Por tanto,
de acuerdo a la seccion 4.4.1, si la velocidad deseada es constante (es decir,
un escalon) entonces el error en estado estacionario ess = d lmt (t)
es constante y diferente de cero, es decir, un controlador proporcional de ve-
locidad no es util para conseguir que el motor alcance la velocidad deseada.
Notese que, de acuerdo a las secciones 4.4.2 y 4.4.3, el problema es mas grave
(es decir, el error en estado estacionario es mayor) si la velocidad deseada
tuviera la forma de una rampa o de una parabola.

! d(s) + I (s) !(s)


k
kp s+a

Figura 4.15. Sistema de control proporcional de velocidad.

La manera de resolver este problema, cuando la velocidad deseada es una


constante, es usando un controlador proporcional-integral (PI). El controlador
PI realiza la siguiente operacion sobre el error de velocidad:
Z t
i = kp e + ki e(r)dr, e = d
0

donde kp y ki son constantes positivas.Usando la transformada de Laplace se


obtiene:
E(s)
I (s) = kp E(s) + ki
s
ki
= kp + E(s)
s
4.4 Error en estado estacionario 209

kp s + ki
= E(s)
s
!
s + kkpi
= kp E(s)
s

donde E(s) es la transformada de Laplace del error de velocidad. Con esto


es posible construir el diagrama de bloques de lazo cerrado que se muestra
en la figura 4.16. Notese que ahora el sistema es tipo 1 porque la funcion de
transferencia de lazo abierto:
!
s + kkpi k
G(s)H(s) = kp
s s+a

tiene un polo en s = 0 y, por tanto, de acuerdo a la seccion 4.4.1 el error en


estado estacionario es cero, es decir, la velocidad del motor alcanza la veloci-
dad deseada cuando el tiempo sea suficientemente grande y si d es constante
(un escalon). As, el termino integral en un controlador PI es introducido con
el fin de llevar a cero el error en estado estacionario. Finalmente, debe acla-
rarse que este resultado sera totalmente cierto solo hasta que se asegure que
el sistema en lazo cerrado sea estable, es decir, hasta que todos los polos de
lazo cerrado tengan parte real negativa.
Por otro lado, notese que, de acuerdo a las secciones 4.4.2 y 4.4.3 el con-
trolador PI de velocidad solo es util para referencias tipo escalon, pues el error
en estado estacionario sigue siendo diferente de cero si la referencia de velo-
cidad tiene forma de una rampa o de una parabola.

! d(s) + k I (s) !(s)


s+k pi k
kp s
s+a

Figura 4.16. Sistema de control proporcional-integral de velocidad.

Ejemplo 4.18 Considere el sistema de control proporcional de posicion de


un motor de CD mostrado en la figura 4.17. Notese que la funcion de trans-
ferencia del motor tiene un polo en s = 0 cuando la posicion es la salida a
controlar, por lo que el sistema es de tipo 1 y el error en estado estacionario
es cero si la posicion deseada es una constante (un escalon) (vease la seccion
4.4.1). Es interesante darse cuenta que este resultado se mantiene (la posicion
del motor alcanzara a la posicion deseada) si se usa cualquiera de los siguien-
tes controladores (veanse los captulos 5 y 10): a) un controlador PD (figura
210 4 Criterios de estabilidad y error

4.18), b) un controlador proporcional de posicion con realimentacion de velo-


cidad (figura 4.19), o c) o un compensador de adelanto (figura 4.20). Aunque
con cualquiera de estos controladores, el requisito de un error cero en estado
estacionario es satisfecho automaticamente por las propiedades matematicas
del modelo del motor (el polo en el origen con el que cuenta), sin embargo el
proposito de todos estos controladores es introducir el amortiguamiento y la
rapidez de respuesta deseados as como asegurar la estabilidad del sistema en
lazo cerrado. Es importante aclarar que si la estabilidad en lazo cerrado no
es asegurada, entonces tampoco se asegura que el error en estado estacionario
sea cero, a pesar de que el sistema sea de tipo 1.

d ( s) + I (s) k
(s)
kp s ( s+a)

Figura 4.17. Control proporcional de posicion.

d(s) + I(s) (s)


kp k
kd s + k d s(s+a)

Figura 4.18. Sistema de control proporcional-derivativo de posicion.

d ( s) + I (s) (s)
+ k
kp s ( s+a)

kv s

Figura 4.19. Control proporcional de posicion con realimentacion de velocidad.


4.4 Error en estado estacionario 211

d ( s) + I (s) k
(s)
s+d
s+c s ( s+a)

Figura 4.20. Control de posicion con un compensador de adelanto.

Ejemplo 4.19 Que sucede en un motor de CD que pueda explicar el porque,


cuando la referencia es un escalon, un controlador proporcional de velocidad
no puede conseguir un error cero en estado estacionario y, en cambio, s lo
puede conseguir un controlador proporcional de posicion?
La respuesta a esta pregunta es la siguiente. Cuando en un sistema de
control proporcional de posicion el error es igual a cero (cuando la posicion
del motor es igual a la posicion deseada) entonces la corriente i = kp (d )
ordenada al motor es cero, el motor se detiene y, por tanto, la condicion
d = puede mantenerse para siempre.
En cambio, en un sistema de control proporcional de velocidad, si la velo-
cidad del motor es igual a la velocidad deseada entonces la corriente ordenada
al motor i = kp (d ) es cero y el motor se detendra. Esto significa que
la condicion d = no puede mantenerse para siempre y como resultado,
en un sistema de control proporcional de velocidad esta variable alcanza, en
estado estacionario, un valor constante tal que la diferencia entre y d sea
suficiente para generar una corriente i = kp (d ) que mantenga girando
al motor en esa velocidad. Cuando
Rt se utiliza un controlador PI de velocidad
entonces la integral del error 0 (d (r))dr es constante cuando d = y
ese valor constante, multiplicado por la ganancia integral ki es suficiente para
producir una corriente que mantiene girando al motor a la velocidad deseada.
Ejemplo 4.20 Considere un sistema de control de posicion de un motor de
CD que cuenta con un controlador PID, es decir, la consigna de corriente
esta dada como:
Z t
de
i = kp e + kd + ki e(r)dr, e = d
dt 0
Usando la transformada de Laplace se obtiene:
E(s)
I (s) = kp E(s) + kd sE(s) + ki
s
ki
= kp + kd s + E(s)
s
kp ki
s2 + kd s + kd
= kd E(s)
s
De este modo se obtiene el diagrama de bloques mostrado en la figura 4.21.
Notese que el motor tiene un polo en s = 0 y el controlador tiene otro polo en
212 4 Criterios de estabilidad y error

s = 0, es decir el sistema es tipo 2 porque la funcion de transferencia de lazo


abierto tiene dos polos en el origen (en s = 0). Esto significa, de acuerdo a
las secciones 4.4.1 y 4.4.2 que la posicion alcanzara a la posicion deseada d
si esta tiene la forma de un escalon o de una rampa. En cambio, el error en
estado estacionario sera diferente de cero y constante si la posicion deseada
tiene la forma de una parabola (vease la seccion 4.4.3).

d(s) + kp
s 2+k s+k i
k I (s) (s)
d d k
kd s s(s+a)

Figura 4.21. Sistema de control PID de posicion.

Xd (s) s+ b + + k X(s)
Ax s+ c

s ( s+ a )
s2
+ 1 2

k s A

Figura 4.22. Control de un sistema ball and beam.

Por otro lado, considere el sistema mostrado en la figura 4.22. Se trata del
sistema de control de posicion de un sistema ball and beam (vease el captulo
12). Notese que la funcion de transferencia de lazo abierto cuenta con dos
polos en s = 0. En este caso, estos dos polos de lazo abierto en el origen son
parte del modelo del sistema ball and beam a controlar, es decir, la planta posee
de manera natural dichos polos y no es necesario introducir un controlador
de tipo integral para generarlos. Por tanto, el error en estado estacionario
sera igual a cero si la posicion deseada xd es un escalon o una rampa, pero si
la referencia es una parabola entonces el error en estado estacionario sera una
constante diferente de cero.
Ejemplo 4.21 Suponga que tiene un motor de CD con funcion de transferen-
cia Gm (s) = I(s) k
(s) = s(s+a) y que se desea que el error en estado estacionario

sea igual a cero cuando la referencia de posicion d sea una parabola. En este
caso se necesita que el sistema sea de tipo 3 y como la planta tiene un polo
4.5 Resumen del captulo 213

en s = 0 es necesario introducir un controlador que tenga dos polos en s = 0.


Por tanto, se propone un controlador de la forma:
Z t Z tZ r
de
i = kp e + kd + ki e(r)dr + kii e( )d dr, e = d
dt 0 0 0

el cual se puede escribir como:


kd s3 + kp s2 + ki s + kii
I (s) = E(s) (4.18)
s2
donde E(s) es la transformada de Laplace del error de posicion, lo cual mues-
tra que tiene dos polos en s = 0 y que, por tanto, es util para resolver el
problema en cuestion. Notese que ademas de introducir el termino de la in-
tegral doble, con ganancia kii , tambien se ha incluido el termino de una in-
tegral sencilla con ganancia ki . Esto se hace para mejorar la estabilidad en
lazo cerrado. Si no se introduce el termino de la integral sencilla entonces se
obtendran pobres desempenos en la respuesta transitoria o incluso se puede
producir inestabilidad. Como regla general, si el controlador ha de introducir
una integral iterada de orden k entonces se deberan incluir tambien terminos
que incluyan todas las integrales iteradas de orden 1 hasta k1. Esto con el fin
de mejorar la respuesta transitoria y asegurar la estabilidad en lazo cerrado.

4.5. Resumen del captulo


En este captulo se han presentado las herramientas preliminares basicas
para el analisis y diseno de sistemas de control de orden arbitrario. Primero se
debe entender que la respuesta de cualquier sistema de control en lazo cerra-
do, por complejo que sea, esta determinada por la funcion de transferencia
equivalente en lazo cerrado.
La representacion de un sistema de control mediante diagramas de bloques
y su correspondiente simplificacion son fundamentales para obtener la funcion
de transferencia de lazo cerrado. A partir de esta funcion de transferencia se
puede determinar i) la estabilidad en lazo cerrado y la respuesta transitoria
(polos de la funcion de transferencia de lazo cerrado), y ii) la respuesta en
estado estacionario (o valor final).
En el captulo 3 se explica que para que una funcion de transferencia sea
estable es necesario y suficiente que todos sus polos tengan parte real negativa.
Sin embargo, el verificar esta condicion mediante el calculo exacto de dichos
polos es un problema complejo. Esto es particularmente cierto cuando el valor
de los coeficientes del polinomio no se conocen numericamente. Esta situacion
es frecuente en el diseno de sistemas de control ya que los coeficientes del poli-
nomio caracterstico dependen de las ganancias del controlador las cuales aun
no se conocen. Mas aun, es deseable que las ganancias del controlador puedan
seleccionarse dentro de un rango de valores con el fin de hacer flexible el di-
seno del sistema de control. Estas caractersticas requieren el uso de tecnicas
214 4 Criterios de estabilidad y error

analticas (y no numericas) para determinar cuando el sistema de control en


lazo cerrado es estable. Este hecho representa un grave problema porque las
formulas analticas para determinar las races de polinomios de grado superior
son complejas. Mas aun, no existe solucion analtica para polinomios de grado
quinto o mayor. Esta problematica es resuelta, finalmente, usando el crite-
rio de estabilidad de Routh el cual, debe recordarse, simplemente representa
una herramienta para verificar si todas las races del polinomio caracterstico
tienen sus partes reales negativas. Por otro lado, la regla de los signos para
determinar la ubicacion de las races de un polinomio, vista en la seccion 4.2,
es un metodo que tiene sus limitaciones. Sin embargo, al ser mucho mas simple
que el criterio de Routh puede tener algunas ventajas en ciertas aplicaciones
y por eso tambien se ha presentado en este captulo.
El estudio del error en estado estacionario que se ha presentado en este
captulo, establece criterios para seleccionar el controlador mas conveniente
a fin de conseguir que la respuesta en estado estacionario alcance al valor
deseado. Dicho de otro modo, para que la respuesta forzada sea igual, o muy
cercana, a la entrada del sistema en lazo cerrado o valor deseado a la salida.
Finalmente, la seleccion del controlador tambien debe hacerse de modo que se
consiga la respuesta transitoria deseada, a partir de una adecuada ubicacion
de los polos de lazo cerrado. La solucion de este problema se presenta en el
captulo siguiente.

4.6. Preguntas de repaso

1. Que es el tipo de un sistema en lazo cerrado?


2. Como se puede aumentar el tipo de un sistema de control?
3. Cual es la relacion entre el criterio de estabilidad de Routh y el requeri-
miento de que todas las races del polinomio caracterstico tengan parte
real negativa?
4. Para que sirve y cual es la principal desventaja de la regla de los signos
vista en la seccion 4.2?
5. Suponga que de acuerdo al estudio del error en estado estacionario se con-
cluye que el valor final de la salida alcanzara el valor deseado Por que es
necesario que el sistema sea estable para que esto sea completamente cier-
to?
6. Suponga que para conseguir un error en estado estacionario igual a cero
necesita usar un controlador que incluya una integral quntuple (5 inte-
grales anidadas) Por que debe incluir tambien las integrales cuadruple
(4 integrales anidadas), triple y doble? Tambien debe incluir la integral
sencilla? Por que? Justifique su respuesta usando un motor de CD como
planta y usando el criterio de Routh.
7. Que relacion existe entre el estudio del error en estado estacionario, pre-
sentado en este captulo, y el objetivo de conseguir que la respuesta for-
4.7 Ejercicios propuestos 215

zada alcance a la entrada del sistema en lazo cerrado (o valor deseado a


la salida)?
8. Considere el tanque que contiene agua estudiado en el ejemplo 3.2 del
captulo 3. Por que un controlador proporcional de nivel no consigue un
error en estado estacionario igual a cero, pero un controlador proporcional-
integral s puede conseguirlo? Justifique su respuesta tambien desde el
punto de vista de la fsica del sistema: Que pasa con el flujo de entrada
cuando el nivel es igual al nivel deseado?
9. Que cuidado debe tener al aplicar el criterio de Routh a polinomios con
races repetidas con parte real cero?
10. El estudio del error en estado estacionario que se ha presentado solo consi-
dera valores deseados a la salida tipo escalon, rampa y parabola Que su-
cede en aplicaciones como la del canon antiaereo (captulo 1) donde no se
conoce de manera exacta cual es la salida deseada?

4.7. Ejercicios propuestos


1. En base al conocimiento del tipo que debe tener un sistema para asegurar
un error en estado estacionario igual a cero para referencias escalon, ram-
pa y parabola, demuestre que la funcion de transferencia de lazo cerrado
correspondiente (vease la figura 4.10) debe tener las siguientes caractersti-
cas:
Los terminos independientes de s, en el numerador y en el denomina-
dor, deben ser iguales para conseguir un error cero en estado estacio-
nario ante una referencia tipo escalon.
Los terminos independientes de s as como los de primer orden en s,
tanto en el numerador como en el denominador, deben ser iguales para
conseguir un error cero en estado estacionario ante una referencia tipo
rampa.
Los terminos independientes de s as como los de primer orden y los de
segundo orden en s, en el numerador y en el denominador, deben ser
iguales para conseguir un error cero en estado estacionario ante una
referencia tipo parabola.
Notese que esto significa que el controlador tambien debe asignar conve-
nientemente los ceros de la funcion de transferencia, lo cual respalda los
argumentos presentados en el ejemplo 4.21 (vease (4.18)).
2. En los ejemplos 3.17 y 3.18 del captulo 3 se presentan explicaciones
basadas en la experiencia cotidiana para entender porque el control
proporcional-integral (expresion en (3.97)) de nivel de agua y el control
proporcional de un sistema masa-amortiguador consiguen que h hd y
x xd cuando t y hd y xd son constantes. Ahora revise esos ejem-
plos y explique esos resultados a partir del conocimiento del tipo de dichos
sistemas de control.
216 4 Criterios de estabilidad y error

3. Considere el sistema masa-resorte-amortiguador presentado en el ejemplo


3.6 del captulo 3. Si se aplica una fuerza constante de valor A y la masa
alcanza el reposo, es decir x = 0 y x = 0, entonces sustituyendo esto
directamente en la ecuacion diferencial correspondiente se obtiene que la
A
posicion que alcanza la masa es x = K . Ahora utilice el teorema del valor
final para calcular el valor final de x cuando f = A. Que relacion existe
entre las condiciones x = 0 y x = 0 y el requisito s 0 del teorema del
valor final?
4. Considere el sistema masa-resorte-amortiguador rotativo:

J + f + K = T

donde J es la inercia, f es el coeficiente de friccion viscosa, K es la cons-


tante de rigidez del resorte, es la posicion angular del cuerpo y T es el
par aplicado el cual esta dado como el siguiente controlador PID:
Z t
de
T = kp e + kd + ki e(r)dr, e = d
dt 0

Use el criterio de Routh para demostrar que las siguientes condiciones:


f + kd ki
J > 0 ki > 0, K + kp > 0, > >0
J K + kp
aseguran la estabilidad en lazo cerrado. Notese que una ganancia integral
ki grande tiende a producir inestabilidad y que este efecto puede ser com-
pensado usando valores grandes de kp y de kd . Tambien puede observarse
que una inercia J pequena permite el uso de ganancias integrales mas
grandes antes de que aparezca la inestabilidad y que lo mismo ocurre si la
constante de rigidez K es grande. Puede encontrar una explicacion desde
el punto de vista de la mecanica (fsica) para este fenomeno?
5. Procediendo como en el ejemplo 4.3 de este captulo, demuestre que la
funcion de transferencia del sistema de lazo cerrado mostrado en la figura
4.3 es:
C(s) G(s)
M (s) = =
R(s) 1 G(s)H(s)
cuando el sistema tiene realimentacion positiva, es decir, cuando el tra-
yecto de realimentacion se suma (en lugar de restarse) en la figura 4.3.
6. Considere el sistema mecanico mostrado en la figura 4.23. En el ejemplo
2.4 del captulo 2 se encontro que el modelo matematico correspondiente
esta dado como:
d2 xm1 b1 dxm1 K 1
+ + (xm1 xm2 ) = F (t)
dt2 m1 dt m1 m1
d2 xm2 b2 dxm2 K
2
+ (xm1 xm2 ) = 0
dt m2 dt m2
4.7 Ejercicios propuestos 217

donde xm1 es la posicion de m1 y xm2 es la posicion de m2 . Aplique la


transformada de Laplace a cada una de las expresiones anteriores para ex-
presar Xm1 (s) y Xm2 (s) como las salidas de dos funciones de transferencia.
Obtenga el diagrama de bloques correspondiente conectando conveniente-
mente estas dos funciones de transferencia de acuerdo a las entradas que
cada una de ellas tiene. Usando el resultado del ejercicio previo, reduzca
este diagrama de bloques para comprobar que:

G1 (s)G2 (s)/m1
Xm2 (s) = F (s)
1 G1 (s)G2 (s)K/m1

donde F (s) es la transformada de Laplace de F (t) y:


1
G1 (s) = b1 K
s2 + m1 s + m1
K
m2
G2 (s) = b2 K
s2 + m2 s + m2

Usando este resultado compruebe que la funcion de transferencia


Xm2 (s)
F (s) tiene un polo en s = 0 Que significa esto? Para ello suponga
que se aplica una fuerza constante F (t) en el tiempo Que pasa con
la posicion de la masa m2 bajo el efecto de esta fuerza? Y que pa-
sara con la posicion de la masa m1 ? Para esto encuentre la funcion de
transferencia existente entre Xm1 (s) y Xm2 (s).
Use el criterio de Routh para encontrar las condiciones bajo las cuales
la funcion de transferencia XFm2(s)(s) no es inestable.
Notese que se puede proceder del mismo modo con los otros ejemplos del
captulo 2 que tambien incluyen resortes.

F (t)
K
m1 m2

b1 b2

Figura 4.23. Dos cuerpos unidos por un resorte.

Al final del captulo 5 se proponen otros ejercicios cuya solucion involucra


el uso de los conceptos estudiados en el presente captulo.
Referencias

1. S. Bennett, A brief history of automatic control, IEEE Control Systems Maga-


zine, pp. 17-25, June 1996.
2. K. Ogata, Ingeniera de Control Moderna, 4a. edicion, Pearson Prentice-Hall,
Madrid, 2003.
3. N.S. Nise, Sistemas de control para ingeniera, 1a. edicion en espanol, 1a. Re-
impresion, CECSA, Mexico, 2004.
4. R.C. Dorf y R.H. Bishop, Sistemas de control moderno, 10a. edicion, Pearson
Prentice-Hall, Madrid, 2008.
5. B.C. Kuo, Sistemas de control automatico, 7a. edicion, Prentice-Hall Hispanoa-
mericana, Mexico, 1995.
6. G.H. Hostetter, C.J. Savant y R.T. Stefani, Sistemas de control, 1a. edicion en
espanol, McGraw-Hill, Mexico, 1992.
5
Diseno usando la respuesta en el tiempo

La herramienta mas importante para disenar sistemas de control usando la


respuesta en el tiempo es el metodo del lugar de las races propuesto por W.R.
Evans entre 1948 y 1950. El propio Evans dijo que la motivacion especfica que
recibio para desarrollar el metodo del lugar de las races vino de una pregunta
que le planteo un alumno durante un curso que imparta en North American
Aviation. De hecho, los primeros en usar el metodo fueron los disenadores de
North American Aviation.
222 5 Diseno usando la respuesta en el tiempo

Objetivos del captulo

Entender que significa lugar de las races.


Aprender a dibujar el lugar de las races.
Analizar y disenar sistemas de control usando el metodo del lugar de las
races.
Considere el sistema en lazo cerrado mostrado en la figura 5.1. En el ejem-
plo 4.3 de la seccion 4.1 se muestra que la funcion de transferencia del sistema
en lazo cerrado esta dada como:
C(s) G(s)
M (s) = = (5.1)
R(s) 1 + G(s)H(s)
En el captulo 3 se explica que la respuesta en el tiempo c(t) = L1 {C(s)} =

R(s) + C(s)
G(s)

H(s)

Figura 5.1. Sistema en lazo cerrado.

L1 {M (s)R(s)} esta dada como la suma de la respuesta natural y de la


respuesta forzada: c(t) = cn (t) + cf (t). Los objetivos del sistema de control en
la figura 5.1 son:
Que el sistema de control en lazo cerrado sea estable, es decir que
lmt cn (t) = 0, lo cual se asegura si todos los polos de la funcion de
transferencia de lazo cerrado M (s) tienen parte real menor que cero. Esto
es importante porque consigue que conforme el tiempo crece la respuesta
del sistema c(t) converge a la respuesta forzada cf (t).
Que la convergencia cn (t) 0 sea conseguida rapidamente.
Que la respuesta forzada sea igual a la salida deseada cf (t) = r(t) =
L1 {R(s)}.
El ultimo punto constituye las caractersticas de respuesta en estado estacio-
nario y la manera de asegurar que el sistema en lazo cerrado responde con las
caractersticas deseadas se estudia en la seccion 4.4. El segundo punto cons-
tituye las caractersticas de respuesta transitoria deseadas y en este captulo
se estudia la manera de disenar un controlador que asegure que el sistema en
lazo cerrado responda con las caractersticas deseadas. Debe subrayarse que al
asegurar que se obtienen las caractersticas deseadas de respuesta transitoria
tambien se debe asegurar la estabilidad del sistema en lazo cerrado.
5.1 Diseno con el lugar de las races 223

El problema de disenar un controlador consiste en asignar conveniente-


mente los polos 1 + G(s)H(s) = 0 y los ceros G(s) = 0 de la funcion de
transferencia de lazo cerrado M (s). En control clasico los polos y los ceros de
la planta siempre se consideran conocidos y la estructura del controlador se
propone como algo conocido (para satisfacer las caractersticas de respuesta
en estado estacionario, por ejemplo). Sin embargo la ubicacion exacta de los
polos y los ceros del controlador debe ser seleccionada de modo que se asegure
que los polos de lazo cerrado 1 + G(s)H(s) = 0 esten colocados en los valores
deseados y que los ceros de lazo cerrado G(s) = 0 esten colocados convenien-
temente. En este captulo se presenta una de las herramientas principales de
control clasico para resolver este problema: el metodo del lugar de las races.
Este metodo determina la ubicacion de los polos de la funcion de transferencia
de lazo cerrado M (s) a partir del estudio de la funcion de transferencia de
lazo abierto G(s)H(s). Ademas, es posible ubicar los ceros de la funcion de
transferencia de lazo cerrado M (s) de modo que su efecto sobre la respuesta
del sistema en lazo cerrado sea pequeno.

5.1. Diseno con el lugar de las races. Caractersticas


deseadas de la respuesta transitoria

Suponiendo que los polos y los ceros de la planta se conocen, el metodo del
lugar de las races es una herramienta grafica que es util para determinar cuales
seran los polos de lazo cerrado si se usa un controlador que contiene ciertos
polos y ceros que se proponen o que se deben calcular. Por otro lado, tambien
es posible utilizar el lugar de las races para conseguir que uno o varios ceros de
lazo cerrado se cancelen con uno o varios polos de lazo cerrado. De acuerdo a la
seccion 3.9.1 esto permite reducir el orden del sistema y eliminar la presencia
de ceros de manera que la respuesta transitoria del sistema en lazo cerrado
puede ser aproximada por uno de los casos sencillos estudiados en las secciones
3.1 y 3.3. Estas caractersticas facilitan la tarea de disenar el controlador de
manera que la funcion de transferencia de lazo cerrado M (s) tenga los polos
y los ceros que aseguren las caractersticas deseadas de respuesta transitoria.
El lugar de las races esta representado por varias curvas cuyos puntos cons-
tituyen los polos del sistema de lazo cerrado obtenidos conforme un parametro,
k, es variado desde k = 0 hasta k = +. De acuerdo a (5.1), todo punto s
que sea un polo de lazo cerrado (y que, por tanto, pertenezca al lugar de las
races) debe cumplir 1 + G(s)H(s) = 0. El lugar de las races se construye
proponiendo puntos s en el plano complejo s, los cuales deben ser verificados
si satisfacen la condicion para ser polos de lazo cerrado: 1 + G(s)H(s) = 0.
Para verificar esta condicion de una manera sencilla se propone un conjunto
de reglas que se listan a continuacion. Estas reglas dan lugar a la construccion
grafica del lugar de las races el cual se dibuja a partir de los polos y los ceros
de la funcion de transferencia de lazo abierto G(s)H(s). Esto significa que los
224 5 Diseno usando la respuesta en el tiempo

polos de lazo cerrado seran determinados a partir de los polos y los ceros de
lazo abierto.
La funcion de transferencia de lazo abierto se puede escribir como:
Qm
j=1 (s zj )
G(s)H(s) = k Qn , n>m (5.2)
i=1 (s pi )

donde zj , j = 1, . . . , m, son los ceros de lazo abierto y pi , i = 1, . . . , n, son


los polos de lazo abierto. Siendo zj , pi y s numeros complejos, en general,
ubicados en el plano s se puede escribir:

s zj = lj j
s pi = li i

como se ilustra en la figura 5.2. Entonces:

Im (s)
s
s
zj
s

lj li
pi

i
j
zj pi Re (s)

Figura 5.2. Representacion grafica de los factores s zj y s pi .

Qm Qm
Xm Xn
j=1 l j j j=1 l j
G(s)H(s) = k Qn = k Qn j i (5.3)
i=1 li i i=1 li j=1 i=1

Por otro lado, los valores de s que satisfacen lo siguiente son los polos de lazo
cerrado:

1 + G(s)H(s) = 0 (5.4)

Esto significa que los polos de lazo cerrado son los valores de s que satisfacen:

G(s)H(s) = 1 = 1 (2q + 1)180 , q = 0, 1, 2, . . . (5.5)

Usando (5.3) y (5.5) se obtiene la condicion de magnitud (5.6) y la condicion


de angulo (5.7) que debe satisfacer todo s que sea polo de lazo cerrado y que,
por tanto, pertenezca al lugar de las races:
5.1 Diseno con el lugar de las races 225
Qm
j=1 lj
k Qn =1 (5.6)
i=1 li
m
X Xn
j i = (2q + 1)180 , q = 0, 1, 2, . . . (5.7)
j=1 i=1

A partir de estas condiciones se obtienen las siguientes reglas.

5.1.1. Reglas para construir el lugar de las races.

1. El lugar de las races empieza (k = 0) en los polos de lazo abierto.


Usando (5.2) y (5.4):
Qm
j=1 (s zj )
1 + G(s)H(s) = 1 + k Qn =0
i=1 (s pi )
Qn Qm
i=1 (s pi ) + k j=1 (s zj )
= Qn =0
i=1 (s p i)
n
Y Ym
= (s pi ) + k (s zj ) = 0 (5.8)
i=1 j=1
Yn
= (s pi ) = 0
i=1

si k = 0. Lo que significa que los polos de lazo cerrado (los que satisfacen
1 + G(s)H(s) = 0) son identicos a los polos de lazo abierto (s = pi ,
i = 1, . . . , n).
2. El lugar de las races termina (k ) en los ceros de lazo
abierto.
Partiendo de (5.8):
n
Y m
Y
1 + G(s)H(s) = (s pi ) + k (s zj ) = 0
i=1 j=1
m
Y
k (s zj ) = 0
j=1
Qn Qm
porque i=1 (s pi ) k j=1 (s zj ) si k . Lo que significa que los
polos de lazo cerrado (los que satisfacen 1 + G(s)H(s) = 0) son identicos
a los ceros de lazo abierto (s = zj , j = 1, . . . , m).
3. Cuando k hay nm ramas del lugar de las races que tienden
hacia algun punto en el infinito del plano s. Esto significa que
la funcion de transferencia de lazo abierto G(s)H(s) tiene n m
ceros en el infinito.
Estas ramas pueden ser identificadas mediante la inclinacion de la linea
226 5 Diseno usando la respuesta en el tiempo

recta a la que cada una de dichas ramas tiende asintoticamente conforme


k . El angulo que cada asntota forma con el eje real positivo se
puede calcular como:
180 (2q + 1)
angulo de la asntota = , q = 0, 1, 2, . . . (5.9)
nm
Esta formula se puede obtener del siguiente modo. Cuando se considera un

asntota
Im (s) s


polos y ceros Re (s)
de lazo abierto

Figura 5.3. Polos y ceros de lazo abierto para determinar las asntotas de la regla
3.

punto s que se encuentra muy lejos del origen sobre una asntota, todos
los polos y todos los ceros de G(s)H(s), o de lazo abierto, se observan
todos reunidos en un punto del plano s, como se muestra en la figura 5.3.
Por tanto, el angulo con que contribuye cada polo y cada cero de lazo
abierto a la condicion en (5.7) (vease la figura 5.3) es identico al de los
demas, es decir, representando dicho angulo por la condicion de angulo
(5.7) se puede escribir como:
m
X n
X
j i = (m n) = (2q + 1)180 , q = 0, 1, 2, . . .
j=1 i=1

Despejando de esta expresion se obtiene:


(2q + 1)180
= , q = 0, 1, 2, . . .
nm
lo cual se convierte en (5.9) al hacer =angulo de la asntota (vease la
figura 5.3).
4. El punto a donde las asntotas intersectan el eje real se calcula
como [5], Cap. 6:
P P
i pi j zj
a =
nm
5.1 Diseno con el lugar de las races 227

5. Considere un punto sobre el eje real del plano s. Suponga que a


la derecha de dicho punto existe un numero de polos (No. po-
losD) y de ceros (No. cerosD) reales que al ser sumados (N =No.
polosD+No. cerosD) dan un numero impar N . Entonces dicho
punto sobre el eje real forma parte del lugar de las races. En
caso contrario tal punto no pertenece al lugar de las races.
Observe la figura 5.4 y considere la condicion de angulo (5.7). Notese que
dos polos o dos ceros complejos conjugados producen angulos que al su-
marse son iguales a 0 o a 360 por lo que no tienen contribucion en la
condicion de angulo (5.7). Esto significa que, en este caso, en la expre-
sion (5.7) solo se deben considerar los polos y ceros reales. Por otro lado,
notese que todo polo y cero real que se encuentre colocado a la izquierda
del punto de prueba s contribuye con un angulo cero. Esto significa que
en la expresion (5.7) solo se deben considerar los polos y ceros reales que
se encuentren a la derecha del punto de prueba s. Notese que cada cero
real a la derecha del punto s contribuye con un angulo de +180 y cada
polo a la derecha del mismo punto contribuye con un angulo de 180 .
Por tanto, en angulo total con el que contribuyen todos los polos y ceros
que estan a la derecha del punto de prueba es:
m
X n
X
j i = No.cerosD (+180 ) + No.polosD (180 )
j=1 i=1

Por otro lado, si la resta de dos numeros es un numero impar entonces

Im (s)

i 180 180
s
0 0
Re (s)
0i 0j

Figura 5.4. Polos y ceros de lazo abierto para estudiar la regla 5.

la suma de los mismos numeros es un numero impar. Por tanto, si:


m
X n
X
j i = (No.cerosD No.polosD) (+180 ) = (2q + 1)180
j=1 i=1
228 5 Diseno usando la respuesta en el tiempo

para algun q = 0, 1, 2, . . ., es decir (No. cerosDNo. polosD) es impar,


entonces tambien se cumple:
m
X n
X
j j = N (+180 ) = (2q + 1)180
j=1 i=1

para algun q = 0, 1, 2, . . ., es decir con N =(No. PolosD+No. cerosD)


impar. Notese que esta ultima expresion constituye la condicion de angulo
(5.7) por lo que el punto de prueba s en la figura 5.4 es un polo de lazo
cerrado y forma parte del lugar de las races.
6. El lugar de las races es simetrico respecto al eje horizontal.
Esto se entiende facilmente si se recuerda que todo polo complejo aparece
siempre simultaneamente con su pareja conjugada (vease el ultimo parrafo
de la seccion 3.6).
7. El angulo de salida de un polo complejo se calcula como:
angulo de salida de
P un polo complejo=
(2q + 1)180 + [angulos de vectores desde los ceros hacia el polo en
cuestion]
P
[angulos de vectores desde los otros polos hacia el polo en cuestion]

(5.10)

La explicacion de esta formula es como sigue. Considere la figura 5.5. El

s Im (s)
pv
pv

i j
pi zj
Re (s)

Figura 5.5. Polos y ceros de lazo abierto para estudiar la regla 7.

punto s es un punto que pertenece al lugar de las races y que esta infini-
tesimalmente cercano al polo en el punto pv . El angulo pv medido como
el angulo formado con respecto al eje horizontal positivo por el vector
trazado desde el polo en pv hacia el punto s es igual al angulo de salida
del polo complejo en pv . La condicion de angulo (5.7) establece que:
m
X n
X
j i =
j=1 i=1
5.1 Diseno con el lugar de las races 229

= (z1 + z2 + + zm ) (p1 + p2 + + pv + + pn )
= (2q + 1)180 , q = 0, 1, 2, . . .
donde zj y pi representan los angulos debidos a los ceros y a los polos de
lazo abierto, respectivamente (puede considerarse que s = pv ). Despejando
pv :
pv = (2q + 1)180 + (z1 + z2 + + zm ) (p1 + p2 + + pn )
para q = 0, 1, 2, . . ., que equivale a la formula (5.10).
8. El angulo de llegada a un cero complejo se calcula como:
angulo de llegadaPa un cero complejo=
(2q + 1)180 [angulos de vectores desde los otros ceros hacia el cero
enP cuestion]
+ [angulos de vectores desde los polos hacia el cero en cuestion]
(5.11)
La explicacion de esta formula es como sigue. Considere la figura 5.6. El

s Im (s)
zv
zv

i j
pi zj
Re (s)

Figura 5.6. Polos y ceros de lazo abierto para estudiar la regla 8.

punto s es un punto que pertenece al lugar de las races y que esta infini-
tesimalmente cercano al cero en el punto zv . El angulo zv medido como
el angulo formado con respecto al eje horizontal positivo por el vector
trazado desde el cero en zv hacia el punto s es igual al angulo de llegada
al cero en zv . La condicion de angulo (5.7) establece que:
m
X n
X
j i =
j=1 i=1
= (z1 + z2 + + zv + + zm ) (p1 + p2 + + pn )
= (2q + 1)180
donde q = 0, 1, 2, . . ., mientras que zj y pi representan los angulos de-
bidos a los ceros y a los polos de lazo abierto, respectivamente (puede
considerarse que s = zv ). Despejando zv :
230 5 Diseno usando la respuesta en el tiempo

zv = (2q + 1)180 (z1 + z2 + + zm ) + (p1 + p2 + + pn )

para q = 0, 1, 2, . . ., que equivale a la formula (5.11).


9. La ganancia de lazo abierto, k, requerida para que un punto s,
perteneciente al lugar de las races, verdaderamente sea selec-
cionado como un polo de lazo cerrado se calcula de manera que
se satisfaga la condicion de magnitud (5.6):
Qn
i=1 li
k = Qm
j=1 lj

10. Los puntos de cruce con el eje imaginario se pueden obtener usando el
criterio de Routh (vease la seccion 4.3).

Finalmente dos reglas practicas:


11. Un polo de lazo abierto (en el semiplano izquierdo) agregado
al lugar de las races tiende a inestabilizar al sistema en lazo
cerrado. Este efecto inestabilizante es mayor conforme el polo
se coloque cada vez mas cerca del origen.
Considere la figura 5.7, donde s representa un punto que pertenece al lugar
de las races y se esta considerando un sistema que en lazo abierto no tiene
ceros y solo tiene los dos polos mostrados. De acuerdo a la condicion de
angulo (5.7):

(p1 + p2 ) = 180

En la figura 5.8 se conservan los polos en p1 y en p2 pero se agrega un

s Im (s)

p2 p1

p2 p1 Re (s)

Figura 5.7. Un punto perteneciente al lugar de las races de un sistema con dos
polos en lazo abierto.

tercer polo en p3 . Ahora la condicion de angulo (5.7) se escribe como:


5.1 Diseno con el lugar de las races 231

Im (s) s

p1
p2 p3

p2 p3 p1 Re (s)

Figura 5.8. El lugar de las races es empujado hacia la derecha al introducir un


polo adicional de lazo abierto.

(p1 + p2 + p3 ) = 180

Esto significa que la suma p1 + p2 debe ser menor en la figura 5.8 que
en la figura 5.7 lo cual se consigue si el punto s en la figura 5.7 se recorre
hacia la derecha como en la figura 5.8, es decir, si el lugar de las races es
doblado hacia la derecha en la figura 5.8. Es facil ver que esta desviacion
es mayor (el lugar de las races es empujado cada vez mas hacia la zona
de inestabilidad) conforme p3 es mayor, es decir, conforme p3 es mas
cercano al origen. Esto es una muestra de que un controlador integral
tiende a inestabilizar a un sistema en lazo cerrado.
12. Un cero de lazo abierto (en el semiplano izquierdo) agregado al
lugar de las races tiende a aumentar la estabilidad del sistema
en lazo cerrado. Este efecto estabilizante es mayor conforme el
cero se coloque cada vez mas cerca del origen.
Considere de nuevo la figura 5.7. De acuerdo a la condicion de angulo
(5.7):

(p1 + p2 ) = 180

En la figura 5.9 se conservan los polos en p1 y en p2 pero se agrega un


cero en z1 . Ahora la condicion de angulo (5.7) se escribe como:

z1 (p1 + p2 ) = 180

Esto significa que la suma p1 + p2 debe ser mayor en la figura 5.9 que
en la figura 5.7 lo cual se consigue si el punto s en la figura 5.7 se recorre
hacia la izquierda como en la figura 5.9, es decir, si el lugar de las races es
doblado hacia la izquierda en la figura 5.9. Es facil ver que esta desviacion
es mayor (el sistema es halado cada vez mas hacia la zona de mayor
estabilidad) conforme z1 es mayor, es decir, conforme z1 es mas cercano
232 5 Diseno usando la respuesta en el tiempo

s Im (s)

p2 z1 p1

p2 z1 p1 Re (s)

Figura 5.9. El lugar de las races es halado hacia la izquierda al introducir un cero
adicional de lazo abierto.

al origen. Esto es una muestra de que el controlador derivativo tiende a


estabilizar a un sistema.

5.2. Ejemplos
5.2.1. Control proporcional de posicion

De acuerdo al captulo 10, el siguiente es el modelo de un motor de CD


cuando no existen perturbaciones externas:
k
(s) = I (s) (5.12)
s(s + a)
b nkm
a = > 0, k = >0
J J
donde (s) e I (s) representan la posicion (salida) y la consigna de corriente
(entrada), respectivamente. Suponga que se usa el siguiente control propor-
cional de posicion:

I (s) = kp (d (s) (s))

donde d (s) es la posicion deseada y kp es una constante conocida como la


ganancia proporcional. El sistema en lazo cerrado se puede representar como
en la figura 5.10, de donde se concluye que la funcion de transferencia en lazo
abierto esta dada como:
kp k
G(s)H(s) = (5.13)
s(s + a)
5.2 Ejemplos 233

Notese que el sistema es tipo 1 por lo que el error en estado estacionario es


cero cuando la posicion deseada es un escalon. Por tanto, el unico problema
de diseno que resta es seleccionar el valor de kp de manera que los polos de
lazo cerrado esten ubicados en los lugares deseados. A continuacion se estudia
este problema usando el metodo del lugar de las races. La ganancia kp es

d(s) + I(s) k
(s)
kp s(s+a)

Figura 5.10. Sistema de control proporcional de posicion.

variada por el metodo para que tome valores desde 0 hasta +. Primero se
reescribe G(s)H(s) en la siguiente forma:
kp k
G(s)H(s) = (1 + 2 )
l1 l2
donde se han definido los vectores s 0 = l1 1 , s (a) = l2 2 (vease
la figura 5.11). Las dos condiciones fundamentales que definen el lugar de las
races son las condiciones de angulo (5.7) y de magnitud (5.6) las cuales se
expresan, respectivamente, como:

(1 + 2 ) = (2q + 1)180 , q = 0, 1, 2, . . .
kp k
=1
l 1 l2
La regla 5 indica que sobre el eje real solo existe lugar de las races entre los
puntos s = 0 y s = a. Ademas, de acuerdo a la regla 1, el lugar de las races
inicia (kp = 0) en s = 0 y s = a. Por otro lado, de acuerdo a las reglas 2 y
3, cuando kp tiende a + las ramas que inician en los puntos s = 0 y s = a
deben terminar en algun cero de lazo abierto (no existe ninguno en este caso)
o en algun punto en el infinito del plano s. Por tanto, el lugar de las races
debe alejarse de los puntos s = 0 y s = a, sobre el eje real, conforme kp
crece de manera que debe existir un punto de separacion en algun lugar entre
dichos puntos para luego dirigirse hacia el infinito sobre el plano s.
Por otro lado, de acuerdo a la condicion de angulo, (1 + 2 ) = 180 =
( + 1 ) en la figura 5.11, se concluye que = 2 y, por lo que los triangulos
t1 y t2 deben ser identicos para cualquier polo de lazo cerrado s. Entonces,
las dos ramas mencionadas anteriormente y que son mostradas en la figura
5.11 deben ser paralelas al eje imaginario. Esto significa que el punto donde
las dos ramas se separan del eje real esta ubicado en el punto medio entre los
polos ubicados en s = 0, s = a, es decir en (0 a)/2 = a/2. Esto tambien
234 5 Diseno usando la respuesta en el tiempo

Im (s)
s

l2 l1
t1 t2

2 1

a a2 0 Re (s)

kp k
Figura 5.11. Lugar de las races para G(s)H(s) = s(s+a)
.

puede verificarse usando las reglas 3 y 4. Finalmente, de acuerdo a la regla 6


ambas ramas son simetricas respecto al eje horizontal.
La condicion de magnitud se usa cuando se necesita conocer el valor exacto
de kp que permita conseguir un punto especfico sobre el lugar de las races.
Notese, por ejemplo, que al crecer kp hacia + las longitudes l1 y l2 deben
crecer para satisfacer la condicion de magnitud
kp k
=1 (5.14)
l1 l2
lo cual significa que los polos de lazo cerrado correspondientes a valores gran-
des de kp tienden a algun punto en el infinito del plano s. Por tanto, se
concluye: i) los dos polos de lazo cerrado son reales, negativos y diferentes
cuando kp > 0 es pequena y ambos se aproximan al punto s = a/2; esto
significa que la rapidez del sistema aumenta porque el polo mas lento se aleja
del origen, ii) de acuerdo a la condicion de magnitud, cuando:

l1 l2 a2 a
kp = = , con l1 = l2 = ,
k 4k 2
los dos polos de lazo cerrado son reales, repetidos, negativos y ubicados en
s = a2 ; por lo que se alcanza la mayor rapidez sin que haya oscilaciones, iii)
a2
conforme kp > 4k se incrementa los dos polos se alejan del eje real (uno hacia
arriba y el otro hacia abajo) sobre la linea vertical que pasa por s = a2 ;
esto significa que el sistema es mas rapido (porque n , la distancia de los
polos al origen, aumenta; vease la seccion 3.3) y la respuesta del sistema
5.2 Ejemplos 235

en lazo cerrado (de segundo orden) es cada vez mas oscilatoria (porque el
angulo 90 disminuye y el amortiguamiento, dado como = sin(90 ),
disminuye; vease la seccion 3.3).
Todo lo anterior significa que no es posible conseguir simultaneamente una
respuesta tan rapida y tan amortiguada como se desee. Esto es una consecuen-
cia directa de que los polos de lazo cerrado no pueden ser ubicados en cualquier
lugar del plano s y solo pueden ser colocados sobre la linea gruesa mostrada
en la figura 5.11. En el siguiente ejemplo se muestra que la introduccion de
un cero en la funcion de transferencia de lazo abierto permite colocar los dos
polos de lazo cerrado en cualquier punto del plano s.

5.2.2. Control proporcional-derivativo (PD) de posicion

Considere de nuevo el modelo de un motor de CD mostrado en (5.12), pero


ahora junto con el siguiente controlador proporcional-derivativo:
de
i = kp e + kd , e = d
dt
donde kp es, como antes, la ganancia proporcional y kd es una constante
conocida como la ganancia derivativa. Usando la transformada de Laplace se
obtiene:

I (s) = kp E(s) + kd sE(s)


= (kp + kd s)E(s)

kp
= kd s + E(s)
kd
por lo que se obtiene el diagrama de bloques mostrado en la figura 5.12.
Entonces, la funcion de transferencia de lazo abierto esta dada como:
kd k(s + c) kp
G(s)H(s) = , c= >0 (5.15)
s(s + a) kd
Notese que ahora es kd la ganancia que el metodo vara desde 0 hasta + para

d(s) + I(s) (s)


kd s + kk pd k
s(s+a)

Figura 5.12. Sistema de control proporcional-derivativo de posicion.

dibujar el lugar de las races. Primero se reescribe G(s)H(s) en la siguiente


forma:
236 5 Diseno usando la respuesta en el tiempo

kd k l3
G(s)H(s) = 3 (1 + 2 ) (5.16)
l1 l2
donde se han definido los vectores s 0 = l1 1 , s (a) = l2 2 , s (c) =
l3 3 . Las condiciones de angulo y de magnitud se expresan, respectivamente,
como:

3 (1 + 2 ) = (2q + 1)180 , q = 0, 1, 2, . . .
kd k l3
=1
l1 l2
El lugar de las races correspondiente a este caso se puede obtener a par-
tir del obtenido para la funcion de transferencia en (5.13) considerando que
simplemente se ha adicionado un cero en s = c.
De acuerdo a la regla 12 el cero sera la causa para que las dos ramas del
lugar de las races mostrado en la figura 5.11 se doblen hacia la izquierda.
Esto puede comprobarse usando la regla 3 para encontrar que ahora existe una
sola rama del lugar de las races que tiende hacia una asntota que forma un
angulo de 1800 con el eje real positivo. Como se muestra en la figura 5.13 el

Im(s)

c a Re(s)

(a) c > a
Im(s)

Re(s)
a c

(b) c < a

kd k(s+c)
Figura 5.13. Lugar de las races para G(s)H(s) = s(s+a)
.

lugar de las races puede tener dos formas diferentes dependiendo de en donde
5.2 Ejemplos 237

se coloque el cero en s = c. Si se coloca a la izquierda del polo en s = a


(como en la figura 5.13(a)) entonces, de acuerdo a la regla 5, existira lugar de
las races sobre dos segmentos del eje real negativo: entre los puntos s = 0 y
s = a y a la izquierda del cero en s = c. Ademas, de acuerdo a las reglas
2 y 3 una de las dos ramas del lugar de las races que inician (kd = 0) en
los polos de lazo abierto colocados en s = 0 y s = a debe tender al cero en
s = c mientras que la otra rama debe tender hacia el infinito del plano s
siguiendo la asntota que forma un angulo de 1800 con el eje real positivo. Por
tanto, debe existir un punto de separacion entre los puntos s = 0 y s = a.
Ademas, como el lugar de las races es simetrico respecto al eje real (regla
6) entonces despues de separarse estas ramas deben formar dos semicrculos
hacia la izquierda del punto de separacion para volverse a unir sobre el eje
real negativo en un punto a la izquierda del cero en s = c para que, luego,
una de las ramas se aproxime al cero en s = c y la otra se vaya hacia el
infinito sobre el eje real negativo.
Por otro lado, si el cero en s = c se coloca entre los polos de lazo abierto
en s = 0 y s = a entonces, de acuerdo a la regla 5, existira lugar de las sobre
los segmentos del eje real negativo colocados entre los puntos s = c y s = 0
as como a la izquierda del polo en s = a. Notese que ahora la rama que
inicia (kd = 0) en s = 0 tiende al cero en s = c mientras que la rama que
inicia (kd = 0) en s = a tiende al infinito sobre el eje real negativo. Notese
tambien que esto es posible sin necesidad de que existan ramas fuera del eje
real, como se muestra en la figura 5.13(b).
A partir de este estudio del lugar de las races, se puede ver que el sistema
en lazo cerrado es estable para cualquier kp > 0 y kd > 0 porque las dos
posibilidades para el lugar de las races que han sido presentadas en la figura
5.13 muestran que los polos de lazo cerrado siempre estan sobre el semipla-
no complejo izquierdo s (polos con parte real negativa). A continuacion se
muestra que siempre existen ganancias kp y kd que permiten colocar los polos
de lazo cerrado en cualquier punto sobre el semi plano complejo izquierdo s
que se desee. De acuerdo a (5.1), la funcion de transferencia de lazo cerrado
esta dada como:
(s) kd k(s + c)
= 2 (5.17)
d (s) s + (a + kd k)s + ckd k
es decir, existen dos polos de lazo cerrado, dados por el lugar de las races, y
un cero en s = c que es precisamente el cero de lazo abierto que aparece en
los lugares de las races mostrados en la figura 5.13. Notese que el polinomio
caracterstico en (5.17) tiene la forma estandar:
s2 + 2n s + n2 (5.18)
Por esta razon se pueden igualar ambos polinomios para concluir que, igua-
lando coeficientes:
a + kd k
n2 = ckd k = kp k, = p (5.19)
2 kp k
238 5 Diseno usando la respuesta en el tiempo
p
polos deseados en lazo cerrado: s = n n 2 1

Esto significa que usando kp y kd se pueden colocar los polos de lazo cerrado en
cualquier punto del semiplano complejo izquierdo s porque se puede asignar
cualquier valor a y a n . Por a otro lado, es comun ubicar los polos de
lazo cerrado (complejos conjugados) de manera que se consiga el tiempo de
subida tr y el sobre paso Mp ( %) deseados. Para esto, normalmente se usan
las expresiones en (3.59) para encontrar:

abs(ln(Mp ( %)/100))
= q (5.20)
2 + ln2 (Mp ( %)/100)
p !!
1 1 2
d = atan
tr
d
n = p (5.21)
1 2

Sin embargo, en el caso del control PD de posicion que se esta estudiando,


la ubicacion de los polos de lazo cerrado en los puntos deseados no asegura
que se obtendra la respuesta transitoria deseada debido a la presencia del cero
colocado en s = c en la funcion de transferencia de lazo cerrado presentada
en (5.17). Este problema motiva el ejemplo mostrado a continuacion en el cual
se usa un compensador de adelanto para controlar la posicion. Sin embargo,
antes de continuar, es conveniente aclarar que a pesar del inconveniente que
se acaba de mencionar para el control PD de posicion su uso es muy comun
en las aplicaciones. Esto se debe a que la sintona del control PD en este tipo
de aplicaciones no necesita del calculo exacto de las ganancias, pues estas se
pueden seleccionar a prueba y error usando la siguiente regla (recuerde que la
funcion de transferencia en (5.17) es estable si kp > 0 y kd > 0):
Fije kd > 0 en un valor e incremente kp > 0 hasta obtener una respuesta
suficientemente rapida. Esto trae como consecuencia una respuesta muy
oscilatoria porque el amortiguamiento disminuye al incrementar kp (vease
(5.19)). En ese momento continue con el siguiente paso.
Mantenga kp > 0 en el ultimo valor obtenido en el paso anterior y em-
piece a incrementar kd > 0 hasta obtener una respuesta suficientemente
amortiguada. Esto, sin embargo, reduce la rapidez de la respuesta porque
el amortiguamiento aumenta. As que mantenga el ultimo valor de kd , re-
grese al punto anterior y repita el procedimiento hasta tener la rapidez y
el sobre paso (amortiguamiento) deseados.

5.2.3. Control de posicion usando un compensador de adelanto

Considere de nuevo el modelo de un motor de CD mostrado en (5.12), pero


ahora junto con el siguiente controlador:
5.2 Ejemplos 239

s+d
I (s) = , c > d > 0, >0
s+c
el cual se conoce como compensador de adelanto porque c > d. Esta condi-
cion (c > d) se introduce cuando se quiere aumentar el amortiguamiento del
sistema, es decir, cuando los polos de lazo cerrado deben ser recorridos hacia
la izquierda del semi plano complejo izquierdo (veanse las reglas 11 y 12). El
diagrama de bloques en lazo cerrado se muestra en la figura 5.14. La funcion
de transferencia de lazo abierto esta dada como:

d ( s) + s+d
I (s) k
(s)
s+c s ( s+a)

Figura 5.14. Control de posicion con una red de adelanto.

k(s + d)
G(s)H(s) = (5.22)
s(s + a)(s + c)

Si el valor de d se propone tal que:

d=a (5.23)

entonces la funcion de transferencia en lazo cerrado es:


(s) k n2
= 2 = 2
d (s) s + cs + k s + 2n s + n2

lo que significa que:

n2
c = 2n , = (5.24)
k
As que si se usan las expresiones en (5.20) y (5.21) para calcular y n de
manera que se consiga el tiempo de subida y el sobre paso deseados, entonces
(5.23) y (5.24) representan una regla de sintona muy simple. En la figura 5.15
se muestra que cuando d = a el lugar de las races es muy similar al obtenido
en la seccion 5.2.1 porque, al cancelarse el polo en s = a y el cero en s = d,
la funcion de transferencia de lazo abierto se reduce a:
k
G(s)H(s) =
s(s + c)
240 5 Diseno usando la respuesta en el tiempo

Im(s)

d
c2 a Re(s)
c

Figura 5.15. Lugar de las races para G(s)H(s) en (5.22) cuando d = a.

que es identica a la funcion de transferencia en (5.13) intercambiando kp por


y a por c. La diferencia radica en que, en el presente caso, al seleccionar c
de acuerdo a (5.24) se asegura que el lugar de las races pasara por los puntos
deseados del semiplano izquierdo complejo s:
p p
s1 = n + jn 1 2 , s2 = n jn 1 2
cuando, de acuerdo a la condicion de magnitud (vease (5.14) y la figura 5.11
con c en lugar de a y en lugar de kp ):
k n2
= 1, l1 = l2 = |s1 | = |s2 | = n =
l1 l2 k
Por tanto, si d = a no es necesario dibujar el lugar de las races. A continuacion
se obtiene el lugar de las races para el caso en que d 6= a, con el fin de entender
que sucedera en tal caso. Por tanto, considerese la funcion de transferencia
de lazo abierto presentada en (5.22). La constante es la ganancia que el
metodo vara desde 0 hasta + para dibujar el lugar de las races. Notese
que, de acuerdo a (5.1) y la figura 5.14, la funcion de transferencia de lazo
cerrado tiene la forma:
(s) k(s + d)
= (5.25)
d (s) (s e)(s g)(s h)
donde e, g y h representan las ubicaciones de los tres polos de lazo cerrado.
Primero se reescribe G(s)H(s) en la siguiente forma:
k l3
G(s)H(s) = [3 (1 + 2 + 4 )] (5.26)
l1 l2 l4
donde se han definido los vectores s 0 = l1 1 , s (a) = l2 2 , s (d) =
l3 3 , s (c) = l4 4 . Las condiciones de angulo (5.7) y de magnitud (5.6)
se expresan, respectivamente, como:
5.2 Ejemplos 241

3 (1 + 2 + 4 ) = (2q + 1)180 , q = 0, 1, 2, . . . (5.27)


k l3
=1 (5.28)
l1 l2 l4
Notese que ahora se tiene n = 3, m = 1, p1 = 0, p2 = a, p3 = c, z1 = d.
De acuerdo a las reglas 1, 2 y 3, una de las tres ramas que inician ( = 0)
en los puntos s = 0, s = a, s = c (polos de lazo abierto) debe terminar
( = +) en el cero de lazo abierto colocado en s = d. Por tanto, existiran
dos ramas del lugar de las races que tienden a algun punto del infinito sobre el
plano s. De acuerdo a la regla 3, los angulos de las asntotas a las que tienden
estas ramas son:
180 (2 0 + 1) 180 (2 0 + 1)
= = 90
nm 31
Ademas, de acuerdo a la regla 4 la interseccion de estas asntotas con el eje
real puede ser ajustada usando el cero en s = d y el polo en s = c:
p1 + p2 + p3 (d) 0ac+d
a = = (5.29)
nm 2
Como c y d deben ser positivas por motivos de estabilidad entonces las asnto-
tas se mueven hacia la izquierda (mayor estabilidad) conforme el cero es ubi-
cado mas cerca del origen (d 0) y/o el polo en c es movido hacia la
izquierda. Esto significa que los polos de lazo cerrado se pueden ubicar del si-
guiente modo: e y g complejos conjugados, mientras que h se selecciona como
real y cercano al cero colocado en s = d. De este modo, el polo y el cero
tienden a disminuir sus efectos sobre la respuesta transitoria del sistema en
lazo cerrado, la cual tiende a ser parecida a la de una funcion de transferencia
con la forma:
(s) eg
= (5.30)
d (s) (s e)(s g)
es decir, la forma estandar de segundo orden (5.18) para que el tiempo de
subida y el sobre paso puedan ser calculados a partir de los valores e y g usando
(3.59) o (5.20) y (5.21). Notese, sin embargo, que esto solo sera completamente
cierto si d = a.
De acuerdo a la regla 5 existe lugar de las races sobre dos segmentos
del eje real porque se tienen cuatro polos y ceros reales de lazo abierto. La
ubicacion de dichos segmentos sobre el eje real dependen del valor de d usado,
como se muestra en las figuras 5.16(a) y 5.16(b). Sin embargo, notese que en
cualquiera de estos casos existe un polo de lazo cerrado que se aproxima al
cero en s = d conforme crece, lo cual es una caracterstica deseable para
conseguir (5.30) y que ocurre cuando d = a.

5.2.4. Control proporcional-integral (PI) de velocidad


De acuerdo al captulo 9, el siguiente es el modelo de un motor de CD
cuando la salida a controlar es la velocidad (s):
242 5 Diseno usando la respuesta en el tiempo

Im(s)

c a Re(s)
d

(a) a > d

Im(s)

c d a Re(s)

(b) a < d

Figura 5.16. Lugares de las races para G(s)H(s) en (5.22).

1 1
(s) = [kI (s) Tp (s)]
s+a J
b nkm
a = > 0, k = >0
J J
donde la consigna de corriente I (s) es la entrada y Tp (s) es una perturbacion
externa de par. Se propone disenar un controlador PI de velocidad, es decir,
se escoge:
Z t
i = kp e + ki e(r)dr, e = d
0
5.2 Ejemplos 243

donde d es la velocidad deseada, kp es la ganancia proporcional y la constante


ki es conocida como la ganancia integral. Usando la transformada de Laplace:

E(s)
I (s) = kp E(s) + ki
s
ki
= kp + E(s)
s

kp s + ki
= E(s)
s
!
s + kkpi
= kp E(s)
s

Por tanto, en lazo cerrado se obtiene el diagrama de bloques mostrado en la


figura 5.17(a). Como este sistema tiene dos entradas, se puede hacer uso del
principio de superposicion (vease la seccion 3.10) para escribir:

(s) = G1 (s)d (s) + G2 (s)Tp (s)

donde G1 (s) es la funcion de transferencia usando d (s) como la entrada y


(s) como la salida cuando Tp (s) = 0, es decir, cuando se usa el diagrama de
bloques de la figura 5.17(b), mientras que G2 (s) es la funcion de transferencia
usando Tp (s) como la entrada y (s) como la salida cuando d (s) = 0, es
decir, cuando se usa el diagrama de bloques de la figura 5.17(c). Es importante
subrayar que cuando Tp (s) es la entrada entonces (s) representa la desviacion
de la velocidad (respecto de d (s)) producida por la perturbacion.
A continuacion se estudia el problema de seleccionar las ganancias del
controlador PI de manera que la respuesta en lazo cerrado tenga las carac-
tersticas deseadas de respuesta transitoria ante la referencia de velocidad d .
Para esto se usa el diagrama de bloques de la figura 5.17(b), de donde se
observa que la funcion de transferencia de lazo abierto es:

kp k(s + c) ki
G(s)H(s) = , c= (5.31)
s(s + a) kp

Notese que el sistema es tipo 1, lo cual asegura que (t) = d en estado


estacionario si d es una constante. Esta es una de las razones de haber elegido
usar un controlador PI en este ejemplo. Por tanto, como las caractersticas
deseadas de la respuesta en estado estacionario estan aseguradas (la velocidad
alcanza la velocidad deseada) solo resta seleccionar las ganancias kp y ki de
manera que sean satisfechas las caractersticas de respuesta transitoria. Para
esto, notese que la funcion de transferencia en lazo abierto mostrada en (5.31)
es identica a la funcion de transferencia mostrada en (5.15) correspondiente al
control PD de posicion ya que solo hay que reemplazar kd por kp . Por tanto, el
lugar de las races correspondiente al control PI de velocidad es identico a los
dos casos mostrados en la figura 5.13 y se obtienen las mismas conclusiones: i)
244 5 Diseno usando la respuesta en el tiempo

T p(s)

1
J


! d(s) + k I (s) + !(s)
s+k pi 1
kp k s+a
s

(a) Sistema de control completo.


! d(s) + k !(s)
s+k pi k
kp s s+a

(b) Caso cuando Tp (s) = 0.

T p(s) !(s)
1 1
J s+a

k
s+k pi
k pk s

(c) Caso cuando d (s) = 0.

Figura 5.17. Sistema de control proporcional-integral de velocidad

siempre existen ganancias kp y ki que permiten colocar los dos polos de lazo
cerrado en cualquier punto sobre el semi plano complejo izquierdo; por tanto,
es posible sintonizar el controlador PI usando un procedimiento de prueba
y error identico al presentado al final de la seccion 5.2.2: solo se debe usar
la ganancia ki (control PI) en lugar de kp (control PD) y usar la ganancia
kp (control PI) en lugar de kd (control PD), ii) el cero colocado en s = c
tambien es un cero de la funcion de transferencia en lazo cerrado G1 (s) lo
que afecta a las caractersticas de respuesta transitoria ante la referencia de
velocidad. Es decir, que la respuesta transitoria no tendra las caractersticas
5.2 Ejemplos 245

disenadas usando (5.20) y (5.21) para seleccionar los polos de lazo cerrado.
Esto plantea las siguientes dos posibilidades para el diseno.
1. El problema indicado en el inciso ii) puede ser eliminado si se elige:

ki
c=a= (5.32)
kp

porque en tal caso, de acuerdo a la figura 5.17(b) y a (5.1), la funcion de


transferencia de lazo cerrado es:
(s) kp k
=
d (s) s + kp k

Esto significa que la repuesta en lazo cerrado, ante la referencia de velo-


cidad, es como la de un sistema de primer orden con ganancia unitaria en
estado estacionario y una constante de tiempo igual a kp1k . Entonces, si se
especifica una constante de tiempo deseada igual a se debe establecer:
1
kp k = (5.33)

As que las condiciones en (5.33) y (5.32) representan una sencilla regla

Im(s)

c
a Re(s)

kp k
Figura 5.18. Lugar de las races para c = a, G(s)H(s) = s
.

de sintona. Finalmente, el lugar de las races correspondientes al caso que


k k
se acaba de estudiar (c = a, G(s)H(s) = ps ) se muestra en la figura
5.18. Esto puede deducirse facilmente usando las reglas 3 y 5, ya que al
solo existir un polo de lazo abierto, solo existe un polo de lazo cerrado, el
cual debe ser real y debe tender a un cero en el infinito (sobre el eje real,
sobre una asntota que forma 180 con el eje real positivo) porque no
hay ningun cero de lazo abierto. Ademas, la condicion de magnitud:
kp k
=1
l1
246 5 Diseno usando la respuesta en el tiempo

donde l1 es la distancia del polo de lazo cerrado deseado al origen, establece


que el polo deseado en lazo cerrado ubicado en s = 1 es alcanzado
cuando:
1 1
kp k = l1 , l1 = kp k =

lo cual coincide con (5.33). Sin embargo, a continuacion se muestra que
esta regla de sintona trae un problema en cuanto a la respuesta del sistema
en lazo cerrado ante la perturbacion externa Tp (s). Para esto, considerese
el diagrama de bloques de la figura 5.17(c). Si se selecciona c = a entonces
la funcion de transferencia de lazo cerrado es:

(s) Jk s
= (5.34)
Tp (s) (s + kp k)(s + a)

Usando el teorema del valor final se encuentra que:

lm (t) = lm s(s)
t s0
Jk s td
= lm s =0
s0 (s + kp k)(s + a) s

la desviacion producida por una perturbacion externa de par de valor


constante igual a td es reducida a cero en estado estacionario. Esta es la
otra razon por la cual se ha elegido usar un controlador PI de velocidad.
Sin embargo, existe un problema. La rapidez con la que tal desviacion es
llevada a cero depende de los polos de la funcion de transferencia mostrada
en (5.34), los cuales estan ubicados en s = kp k y s = a. Aunque uno
de estos polos puede ser hacerse tan rapido como se desee usando un valor
grande de kp , la rapidez del otro polo (s = a) no puede ser modificada y
depende de la rapidez que el motor de CD tiene en lazo abierto. Esto trae
como consecuencia que la desviacion debida a la perturbacion puede ser
llevada a cero muy lentamente, lo cual representa un serio inconveniente.
2. Tratando de resolver el problema que se acaba de indicar se puede optar
por abandonar la regla de sintona representada por (5.33) y (5.32). Como
ahora c 6= a, la funcion de transferencia de lazo cerrado correspondiente
al diagrama de bloques de la figura 5.17(c) es:

(s) Jk s
= 2 (5.35)
Tp (s) s + (a + kp k)s + kp kc

Usando de nuevo el teorema del valor final se puede verificar facilmente


que si la perturbacion externa es constante Tp (s) = tsd entonces la desvia-
cion producida en estado estacionario es cero de nuevo: lmt (t) = 0,
debido a que la funcion de trasferencia en (5.35) tiene un cero en s = 0.
Por otro lado, los polos de la funcion de transferencia en (5.35), que son los
5.2 Ejemplos 247

que determinan la rapidez con la que la desviacion de velocidad desapare-


ce, son identicos a los polos de la funcion de transferencia (s)
d (s)
= G1 (s),
por lo que pueden ser determinados usando el metodo del lugar de las
races a partir de (5.31). Tal como ya se ha explicado, el lugar de las
races correspondiente es identico a los dos casos mostrados en la figura
5.13 sustituyendo el uso de kd por el de kp . Es muy importante subrayar
que la funcion de transferencia en (5.35) no tiene el cero en s = c que
se muestra en el lugar de las races de la figura 5.13. Esto significa que
ninguno de los dos polos de lazo cerrado obtenidos con el metodo del lugar
de las races podra cancelarse con el cero en s = c y el polo mas lento
tendra el efecto mas importante sobre la rapidez con la que la desviacion
debida a la perturbacion es llevada a cero. Con esto en mente se concluye
lo siguiente.
Con el fin de que el cero en s = c tenga poco efecto sobre la respuesta
transitoria ante la referencia de velocidad, uno de los polos de lazo
cerrado debe seleccionarse cerca del cero en s = c. El otro polo de
lazo cerrado (el mas rapido) se aleja hacia la izquierda y tiende al
infinito conforme el polo lento se acerca a s = c.
Esto significa que el polo rapido determina las caractersticas de res-
puesta transitoria (constante de tiempo) ante la referencia de velo-
cidad. Entonces, si se desea establecer cierto valor para la constante
de tiempo (de manera que el polo rapido ocupe un punto finito sobre
el eje real negativo), el polo lento siempre estara relativamente lejos
del cero en s = c (a donde convergera cuando el polo rapido llegue
al infinito). Esto significa que la respuesta transitoria estara afecta-
da por los dos polos y el cero en s = c. Por tanto, si c 6= a, no se
puede determinar una regla de sintona que de manera exacta fije las
caractersticas de respuesta transitoria ante la referencia de velocidad.
Es mas conveniente seleccionar c > a porque el polo de lazo cerrado
mas lento (el que se aproxima a s = c) queda colocado mas a la
izquierda (es mas rapido) que si selecciona c < a.
Por esta misma razon, si se quiere aumentar la rapidez con la que el
efecto de la perturbacion desaparece, se debe seleccionar c 6= a con
c > 0 cada vez mas grande. De acuerdo a c = ki /kp , esto significa que
se necesita una ganancia integral mayor.
Por tanto, aunque es posible aumentar la rapidez con la que desaparece
la desviacion producida por la perturbacion, se concluye que no se pue-
den calcular de manera exacta las ganancias kp y ki que aseguren que
se consiguen, simultaneamente, las caractersticas deseadas de respuesta
transitoria ante la referencia deseada y un rechazo rapido de los efectos
de la perturbacion. Esta afirmacion es verificada experimentalmente en
el captulo 9 y, por ello, en ese captulo se presenta un controlador PI
modificado de velocidad que resuelve este problema.
248 5 Diseno usando la respuesta en el tiempo

Previendo su uso experimental en el captulo 9, a continuacion se propone una


regla de sintona para el caso cuando c 6= a. De acuerdo a (5.31) la condicion
de magnitud es:
kp kl1
=1
l3 l2

donde s (0) = l2 2 , s (a) = l3 3 , s (c) = l1 1 . El criterio


de sintona seleccionado es proponer que el polo mas lento este ubicado en
un valor conocido s = p1 , para fijar un lmite inferior en la rapidez con
la que se rechaza el efecto de la perturbacion. Por otro lado, de acuerdo a
los puntos listados previamente, se propone c cercano a p1 de manera que
p1 > c. Entonces, usando la condicion de magnitud previa se obtiene la regla
de sintona:
ki l 2 l3
= c, c < p1 , kp = (5.36)
kp l1 k
l1 = abs(p1 + c), l2 = abs(p1 ), l3 = abs(p1 + a)

De acuerdo a lo expuesto previamente, la respuesta ante la referencia de ve-


locidad sera mucho mas rapida que la dictada por el polo en s = p1 . Para
propositos de comparacion, esto es muy importante pues en el captulo 9 se
disenan algunos controladores de velocidad que consiguen simultaneamente
respuestas transitorias ante una referencia de velocidad y una perturbacion
externa que son determinadas por un polo en s = p1 . En cambio con el
control PI de velocidad aqu estudiado, si se desea aumentar la rapidez de res-
puesta ante una perturbacion externa (con un polo en s = p1 ), la respuesta
ante la referencia de velocidad debe ser mucho mas rapida.

5.2.5. Control proporcional-integral-derivativo (PID) de posicion

Considere de nuevo el modelo de un motor de CD pero ahora considerando


la presencia de una perturbacion externa:
1 1
(s) = [kI (s) Tp (s)]
s(s + a) J

junto con el siguiente controlador proporcional-integral-derivativo:


Z t
de
i = kp e + kd + ki e(r)dr, e = d
dt 0

donde d es la posicion deseada y las constantes kp , kd y ki se conocen como


las ganancias proporcional, derivativa e integral, respectivamente. Usando la
transformada de Laplace se obtiene:
5.2 Ejemplos 249

E(s)
I (s) = kp E(s) + kd sE(s) + ki
s
ki
= kp + kd s + E(s)
s
kp ki
s2 + kd s + kd
= kd E(s)
s
por lo que se obtiene el diagrama de bloques mostrado en la figura 5.19(a).
Como este sistema tiene dos entradas entonces se puede usar el principio de
superposicion (vease la seccion 3.10) para escribir:

(s) = G1 (s)d (s) + G2 (s)Tp (s)

donde G1 (s) es la funcion de transferencia usando d (s) como la entrada y


(s) como la salida cuando Tp (s) = 0, es decir, cuando se usa el diagrama de
bloques de la figura 5.19(b) para encontrar:

2 kp ki
(s) kd k s + kd s + kd
= G1 (s) = 3 , Tp (s) = 0 (5.37)
d (s) s + (a + kd k)s2 + kp ks + ki k
Por otro lado, G2 (s) es la funcion de transferencia usando Tp (s) como la
entrada y (s) como la salida cuando d (s) = 0, es decir, cuando se usa el
diagrama de bloques de la figura 5.19(c) para encontrar:

(s) Jk s
= G2 (s) = 3 , d (s) = 0 (5.38)
Tp (s) s + (a + kd k)s2 + kp ks + ki k
Es importante subrayar que cuando Tp (s) es la entrada entonces (s) re-
presenta la desviacion de la posicion (respecto de d (s)) producida por la
perturbacion. Usando el teorema del valor final se encuentra que:

lm (t) = lm s(s)
t s0
Jk s td
= lm s =0
s0 s3 + (a + kd k)s2 + kp ks + ki k s
la desviacion de posicion en estado estacionario producida por una pertur-
bacion externa de par constante Tp (s) = tsd es cero. Utilizando de nuevo el
teorema del valor final, no es difcil comprobar que, usando (5.37), el valor
final de posicion es igual al valor deseado d cuando este es constante. Estas
son las principales razones para usar un controlador PID de posicion.
A continuacion se estudia el problema de seleccionar las ganancias del
controlador PID de manera que la respuesta en lazo cerrado tenga las ca-
ractersticas deseadas de respuesta transitoria ante la referencia de posicion
d . Con este proposito, los tres polos de la funcion de transferencia en (5.37)
deben ser asignados en los puntos deseados sobre el semiplano complejo iz-
quierdo. Esto se consigue igualando el polinomio caracterstico de la funcion
250 5 Diseno usando la respuesta en el tiempo

T p(s)

1
J


d(s) + s 2 kp k
+k s+k i
I (s) + (s)
1
kd d
s
d k s(s+a)

(a) El sistema de control completo.

d(s) + kp k
s 2+k s+k i
(s)
d d
k
kd s s(s+a)

(b) Caso cuando Tp (s) = 0.

T p(s) (s)
1 1
J s(s+a)

kp k
s 2+k s+k i
d d
k dk s
(c) Caso cuando d (s) = 0.

Figura 5.19. Sistema de control PID de posicion

de transferencia en (5.37) con un polinomio que tiene sus tres races en los
puntos deseados s = p1 , s = p2 , s = p3 :
s3 + (a + kd k)s2 + kp ks + ki k = (s p1 )(s p2 )(s p3 )
Es claro que a los tres coeficientes del polinomio caracterstico se les puede
asignar cualquier valor con combinaciones adecuadas de las ganancias kp , kd
y ki . Esto significa que los tres polos del sistema en lazo cerrado pueden ser
asignados en cualquier lugar que se desee del semiplano complejo izquierdo.
Una manera de seleccionar los polos deseados es: dos complejos conjugados
con parte real negativa y el otro real y negativo (para asegurar estabilidad),
es decir:
5.2 Ejemplos 251

p1 = 1 + j1 , p2 = 1 j1 , p3 < 0, 1 < 0, 1 > 0

Si se desea que la respuesta sea dominada por los dos polos complejos conju-
gados entonces se puede proponer:

|p3 | > 6|1 |

Con estos datos se obtiene:

s3 + (a + kd k)s2 + kp ks + ki k = (s p1 )(s p2 )(s p3 ) (5.39)


= s3 (21 + p3 )s2 + (12 + 12 + 21 p3 )s p3 (12 + 12 )

de donde, igualando coeficientes, se obtiene la siguiente regla de sintona:

(21 + p3 ) a
kd = (5.40)
k
12 + 12 + 21 p3
kp =
k
p3 (1 + 12 )
2
ki =
k
Notese que las tres ganancias del controlador son positivas. Aunque la parte
real e imaginaria de los polos en p1 y p2 pueden ser calculadas usando (5.20) y
(5.21) de manera que se obtenga el tiempo de subida tr y el sobre paso Mp ( %)
deseados, sin embargo la respuesta obtenida tendra diferencias importantes
respecto de estos valores deseados debido a los dos ceros que tiene la funcion
de transferencia en (5.37). Aunque esta es una desventaja importante de la
regla de sintona en (5.40), estos valores pueden ser usados como una simple
aproximacion de las ganancias requeridas del controlador para posteriormente
hacer ajustes finos, a prueba y error, hasta obtener las caractersticas deseadas
de respuesta transitoria. Para esto, dado que el sistema en lazo cerrado es de
tercer orden, es muy importante tener presente la regla de estabilidad obtenida
en el ejemplo 4.12 de la seccion 4.3. La posibilidad de ajustar a prueba y error
las ganancias de un controlador PID (vease la seccion 5.3) es una de las
principales razones por las que este tipo de controlador tiene tanto uso en la
industria.
Con el fin de buscar una regla de sintona que permita calcular de mane-
ra exacta las ganancias de un controlador PID, a continuacion se procede a
estudiar el lugar de las races para el control PID de posicion. Para esto se
usa el diagrama de bloques de la figura 5.19(b), de donde se observa que la
funcion de transferencia de lazo abierto es:
kd k(s + )(s + ) kp ki
G(s)H(s) = , (s + )(s + ) = s2 + s + (5.41)
s2 (s + a) kd kd

para algunas constantes y diferentes de cero cuyos valores se proponen


como parte del proceso del diseno para despues, a partir de estos valores,
252 5 Diseno usando la respuesta en el tiempo

calcular kp y ki . Notese que kd es la ganancia que el metodo vara desde 0


hasta + para dibujar el lugar de las races. Es claro que el sistema es tipo
2 (el motor tiene un integrador por naturaleza y el otro integrador es debido
al controlador PID) y, por tanto, el error en estado estacionario ante una
referencia de posicion constante es cero.
En la figura 5.20 se presentan tres posibilidades para el lugar de las races
correspondiente, las cuales dependen de los valores propuestos para y . Se
invita al lector a usar las reglas presentadas en la seccion 5.1.1 para comprobar
estos resultados. De acuerdo a la figura 5.20(a), se puede disenar el sistema
de control de manera que dos polos de lazo cerrado sean muy proximos a
los dos ceros colocados en s = y s = para que el sistema en lazo
cerrado responda como un sistema de primer orden con un polo real y negativo.
Tambien se puede elegir que un polo de lazo cerrado sea muy proximo al cero
en s = de modo que el sistema en lazo cerrado responda como un sistema
de segundo orden, con polos complejos conjugados, que contiene un cero.
Aunque la presencia de este cero modifica la forma de la respuesta transitoria,
es una manera de conseguir una respuesta con especificaciones aproximadas
de tiempo de subida y sobre paso deseados. Este es el criterio de diseno que
se usa a continuacion.
En casos como este, los metodos tradicionales del lugar de las races pro-
ponen seguir los siguientes tres pasos:
Disene un controlador PD de posicion con funcion de transferencia:

kd (s + )

de manera que se obtengan el tiempo de subida y el sobre paso deseados.


A la funcion de transferencia de lazo abierto disenada en el paso anterior,
agregue el factor:
s+
s
con un valor positivo muy cercano a cero.
Calcule las ganancias PID usando (5.41), es decir:

kp = ( + )kd , ki = kd (5.42)

A continuacion se disena un controlador PD de la forma kd (s + ) para


k
la planta s(s+a) , es decir, cuando el sistema en lazo cerrado tiene la forma
presentada en la figura 5.21 y la funcion de transferencia de lazo abierto es:
kd k(s + )
G(s)H(s) = (5.43)
s(s + a)
La funcion de transferencia de lazo cerrado es, en este caso:
(s) kd k(s + )
= 2
d (s) s + (a + kd k)s + kd k
5.2 Ejemplos 253

Im(s)

+
a Re(s)

(a)
Im(s)

+
a Re(s)

(b)

Im(s)

+
a Re(s)


(c)

Figura 5.20. Diferentes posibilidades para el lugar de las races del control PID de
posicion.
254 5 Diseno usando la respuesta en el tiempo

Igualando a un polinomio de segundo grado estandar:

s2 + (a + kd k)s + kd k = s2 + 2n s + n2

se obtiene:
2n a n2
kd = , = (5.44)
k kd k
Los valores de y n se pueden calcular usando (5.20) y (5.21) a partir de

d(s) + (s)
k d(s + ) k
s(s+a)

Figura 5.21. Control PD de posicion.

los valores deseados de tiempo de subida y sobre paso. El lugar de las races
correspondiente a este caso se muestra en la figura 5.22 y es identico al caso
c > a mostrado en la figura 5.13, porque solo en este caso el control PD de
posicion puede producir polos complejos conjugados de lazo cerrado. A partir
de (5.43) se encuentra que las condiciones de angulo y de magnitud establecen:
kd kl3
3 (1 + 2 ) = 180 (2q + 1), q = 1, 2, . . . =1 (5.45)
l1 l2
donde l1 , l2 , l3 , 1 , 2 y 3 estan definidas en la figura 5.22. Cuando se agrega el
factor s+
s a la funcion de transferencia de lazo abierto en (5.43) se encuentra
que la funcion de transferencia de lazo abierto ahora es:
kd k(s + )(s + )
G(s)H(s) = (5.46)
s2 (s + a)
Como > 0 es pequena, el lugar de las races correspondiente tiene la forma
mostrada en la figura 5.23 (se invita al lector a usar las reglas presentadas
en la seccion 5.1.1 para comprobar este resultado). Las condiciones de angulo
y de magnitud correspondientes a este caso se establecen a partir de (5.46)
como:
kd kl3 l5
3 + 5 (21 + 2 ) = 180 (2q + 1), q = 1, 2, . . . = 1 (5.47)
l12 l2

donde l1 , l2 , l3 , 1 , 2 y 3 son identicas a las definidas en la figura 5.22,


mientras que l5 y 5 se definen en la figura 5.23. La razon de seleccionar
5.2 Ejemplos 255
POLO DESEADO
Im(s)

l3 l2 l1
1
3 2

a Re(s)

Figura 5.22. Lugar de las races para el sistema en la figura 5.21.

Im(s)

5
l1
l3 l2 l5 1
3 2

" +
a Re(s)

Figura 5.23. Lugar de las races para la funcion de transferencia de lazo abierto
mostrada en (5.46).

> 0 cercana a cero es para conseguir que l1 y l5 sean casi iguales de manera
que l5 /l1 1. Esto tambien asegura que 1 y 5 son casi iguales por lo que
5 1 0. Entonces, las condiciones de angulo y de magnitud en (5.45) y
(5.47) son casi identicas. Esto asegura que los polos de lazo cerrado que se
obtienen cuando la funcion de transferencia de lazo abierto es la presentada
en (5.43) son casi identicos a los polos de lazo cerrado obtenidos cuando la
funcion de transferencia de lazo abierto es la presentada en (5.46). As se
asegura que las caractersticas de respuesta transitoria (tiempo de subida y
sobre paso) desenadas con el controlador PD en (5.44) tambien se consiguen
con el controlador PID:
256 5 Diseno usando la respuesta en el tiempo
k ki
(s + )(s + ) s2 + kdp s + kd
kd = kd
s s
es decir, cuando las ganancias se seleccionan de acuerdo a (5.42).
Sin embargo, es importante resaltar una gran desventaja de este metodo
de diseno: de acuerdo a (5.42) un valor pequeno de resulta en un valor
pequeno de la ganancia integral ki . La principal consecuencia de esto es que
la desviacion de posicion debida a la perturbacion externa es llevada a cero
muy lentamente y esto puede ser inaceptable en la practica. Esto tambien se
puede explicar a partir del lugar de las races de la figura 5.23. Notese que
un polo de lazo cerrado (colocado digamos en s = , > 0) se aproxima
al cero colocado en s = , por lo que ambos se cancelan en la funcion de
transferencia presentada en (5.37) y no se aprecia el efecto de ninguno de
ellos en la respuesta transitoria ante la referencia de posicion. Sin embargo, el
cero en s = no aparece en la funcion de transferencia mostrada en (5.38).
Pero el polo en s = aun esta presente en esta funcion de transferencia y
afecta considerablemente a la respuesta transitoria: este polo lento (cercano
al origen) es el responsable de una respuesta transitoria muy lenta cuando
aparece una perturbacion externa.
A pesar de estos inconvenientes, el metodo del lugar de las races reco-
mienda disenar los controladores PID de esta manera. Mas aun, es interesante
mencionar que estos inconvenientes en los metodos clasicos de diseno siguen
sin solucion a pesar de que ya han sido puntualizados previamente en algunos
trabajos internacionales como el de la referencia [10].
Por otro lado, de acuerdo a (5.42), se puede obtener una ganancia integral
mas grande (para obtener un rechazo mas rapido de la perturbacion) selec-
cionando un valor mas grande de . Sin embargo, de acuerdo a lo expuesto
previamente, esto resultara en una respuesta transitoria ante la referencia de
posicion que no tiene las caractersticas deseadas. Estos razonamientos per-
miten afirmar que no existe una regla de sintona que permita calcular de
manera exacta las ganancias de un controlador PID de posicion de modo que
se consigan simultaneamente las caractersticas deseadas de respuesta transi-
toria ante una referencia de posicion y un rechazo satisfactorio de los efectos
de una perturbacion externa de par. Estas observaciones se verifican experi-
mentalmente en el captulo 10 donde, dada la problematica que se acaba de
describir, se presentan y se prueban experimentalmente nuevos controladores
que eliminan estas desventajas.
Finalmente, a pesar de las desventajas arriba mencionadas, es importante
recordar lo que se indico justo despues de (5.40): el controlador PID es uno
de los controladores mas utilizados a nivel industrial debido a que puede ser
sintonizado a prueba y error (vease la seccion 5.3) de manera que se respete
la regla de estabilidad obtenida en el ejemplo 4.12 de la seccion 4.3.
5.2 Ejemplos 257

5.2.6. Asignacion de los polos de lazo cerrado deseados

En esta parte se presenta un ejemplo para mostrar como se usa el lugar


de las races para disenar un controlador de modo que se asignen los polos de
lazo cerrado deseados. Considere la siguiente funcion de transferencia:
k
G(s)H(s) = (5.48)
(s 35.7377)(s + 36.5040)

La ganancia k es variada por el metodo para que tome valores desde 0 hasta
+. Primero se reescribe G(s)H(s) en la siguiente forma:

k
G(s)H(s) = (1 + 2 )
l1 l 2

donde se han definido los vectores s 35.7377 = l1 1 , s (36.5040) =


l2 2 . Las dos condiciones fundamentales que definen el lugar de las races
son las condiciones de angulo (5.7) y de magnitud (5.6) las cuales se expresan,
respectivamente, como:

(1 + 2 ) = (2q + 1)180 , q = 0, 1, 2, . . .
k
=1
l1 l2
La regla 5 indica que sobre el eje real solo existe lugar de las races entre
los puntos s = 35.7377 y s = 36.5040. Ademas, de acuerdo a la regla 1, el
lugar de las races inicia (k = 0) en s = 35.7377 y s = 36.5040. Por otro
lado, de acuerdo a las reglas 2 y 3, cuando k tiende a + las ramas que
inician en los puntos s = 35.7377 y s = 36.5040 deben terminar en algun
cero de lazo abierto (no existe ninguno en este caso) o en algun punto en el
infinito del plano s. Por tanto, el lugar de las races debe alejarse de los puntos
s = 35.7377 y s = 36.5040, sobre el eje real, conforme k crece de manera
que debe existir un punto de separacion en algun lugar entre dichos puntos
para luego dirigirse hacia el infinito sobre el plano s.
Por otro lado, de acuerdo a la condicion de angulo, (1 + 2 ) = 180 =
( + 1 ), y la figura 5.24 se puede observar que = 2 y, por tanto, que
los triangulos t1 y t2 deben ser identicos para cualquier polo de lazo cerrado
s. Entonces, las dos ramas mencionadas anteriormente y que son mostradas
en la figura 5.24 deben ser paralelas al eje imaginario. Esto significa que el
punto donde las dos ramas se separan del eje real esta ubicado en el punto
medio entre los polos ubicados en s = 35.7377, s = 36.5040, es decir en
(35.7377 36.5040)/2 = 0.7663. Esto tambien puede verificarse usando las
reglas 3 y 4. Finalmente, de acuerdo a la regla 6 ambas ramas son simetricas
respecto al eje horizontal.
La condicion de magnitud se usa cuando se necesita conocer el valor exacto
de k que permita conseguir un punto especfico sobre el lugar de las races.
258 5 Diseno usando la respuesta en el tiempo

Im (s)
s

l2 l1
t1 t2

2 1

36:50 0:7663 35:73


Re (s)

Figura 5.24. Lugar de las races para G(s)H(s) en (5.48).

Notese, por ejemplo, que al crecer k hacia + las longitudes l1 y l2 deben


crecer para satisfacer la condicion de magnitud
k
=1
l1 l2
lo cual significa que los polos de lazo cerrado correspondientes a valores gran-
des de k tienden a algun punto en el infinito del plano s.
Suponga ahora que se incluye un polo adicional a la funcion de transferen-
cia en (5.48) para tener:
116137 k
G(s)H(s) = =
s3 + 72.54s2 1250s 9.363 104
116137 k
= (5.49)
(s 35.7377)(s + 36.5040)(s + 71.7721)
De nuevo, la constante k es la ganancia que el metodo vara desde 0 hasta
+ para dibujar el lugar de las races. Primero se reescribe G(s)H(s) en la
siguiente forma:
116137 k
G(s)H(s) = (1 + 2 + 3 )
l 1 l 2 l3
donde se han definido los vectores s35.7377 = l1 1 , s(36.5040) = l2 2 ,
s (71.7721) = l3 3 . Las condiciones de angulo (5.7) y de magnitud (5.6)
se expresan, respectivamente, como:
(1 + 2 + 3 ) = (2q + 1)180 , q = 0, 1, 2, . . .
116137 k
=1
l1 l2 l3
5.2 Ejemplos 259

El lugar de las races correspondiente a este caso se puede obtener a par-


tir del obtenido para la funcion de transferencia en (5.48) considerando que
simplemente se ha adicionado un polo en s = 71.7721.
De acuerdo a la regla 11 el nuevo polo sera causa para que las dos ramas del
lugar de las races mostrado en la figura 5.24 se doblen hacia la derecha como
se alcanza a apreciar ligeramente en la figura 5.25. Esto puede comprobarse
usando la regla 3 para encontrar que ahora existen tres ramas del lugar de las
races que tienden hacia asntotas que forman angulos de 180 y 60 con
el eje real positivo.

Root Locus
15

10

5
Imaginary Axis

10

15
80 60 40 20 0 20 40
Real Axis

Figura 5.25. Lugar de las races para G(s)H(s) en (5.49).

Por otro lado, el punto de separacion entre los puntos s = 35.7377 y


s = 36.5040 que en la figura 5.24 estaba colocado en el punto (35.7377
36.5040)/2 = 0.7663 ahora en la figura 5.25 se encuentra colocado mas hacia
la derecha que 0.7663. La razon de esto se explica en la figura 5.26 donde s
y s representan dos puntos sobre el lugar de las races que estan muy cerca del
punto de separacion para el caso de las figuras 5.24 y 5.25, respectivamente.
Como en la figura 5.25 se debe cumplir que (1 + 2 + 3 ) = 180 mientras
que en la figura 5.24 se debe cumplir (1 + 2 ) = 180 , entonces ambos 1
y 2 deben ser menores que 1 y 2 . Esto significa que el punto s debe estar
desplazado hacia la derecha del punto s . Notese que este desplazamiento del
punto de separacion hacia la derecha del punto 0.7663 es mayor conforme
el angulo 3 introducido por el polo en s = 71.7721 sea mayor, es decir,
260 5 Diseno usando la respuesta en el tiempo

conforme este polo se encuentre colocado mas hacia la derecha. De hecho,


en la figura 5.25 se observa que el punto de separacion esta colocado en el
semiplano derecho.

Im (s )
s; s

2
;
; 1 2
3 1

0:7663 Re (s )

Figura 5.26. Un polo adicional recorre el punto de separacion hacia la derecha.

Esta descripcion del lugar de las races de la figura 5.25 permite concluir
que siempre existira al menos un polo de lazo cerrado que tiene parte real
positiva, es decir, habra inestabilidad en lazo cerrado para cualquier valor
positivo de k. Debido a que k se puede interpretar como la ganancia de un
controlador proporcional, se concluye que no es posible estabilizar el sistema
usando ningun controlador proporcional y debe intentarse otro controlador.
De acuerdo a la regla 12 se requiere usar un controlador que introduzca un
cero de lazo abierto ya que esto consigue doblar el lugar de las races hacia
la izquierda para conseguir estabilidad de lazo cerrado.
Considere la siguiente funcion de transferencia de lazo abierto:
116137(s + b)
G(s)H(s) = k = (5.50)
s3 + 72.54s2 1250s 9.363 104
116137(s + b)
=k
(s 35.7377)(s + 36.5040)(s + 71.7721)
con b una constante positiva. De nuevo, la constante k es la ganancia que el
metodo vara desde 0 hasta + para dibujar el lugar de las races. Primero
se reescribe G(s)H(s) en la siguiente forma:
116137 k l4
G(s)H(s) = [4 (1 + 2 + 3 )] (5.51)
l1 l2 l3
donde se han definido los vectores s35.7377 = l1 1 , s(36.5040) = l2 2 ,
s (71.7721) = l3 3 , s (b) = l4 4 . Las condiciones de angulo (5.7) y
de magnitud (5.6) se expresan, respectivamente, como:

4 (1 + 2 + 3 ) = (2q + 1)180 , q = 0, 1, 2, . . . (5.52)


116137 k l4
=1 (5.53)
l1 l2 l3
5.2 Ejemplos 261

Notese que ahora se tiene n = 3, m = 1, p1 = 35.7377, p2 = 36.5040,


p3 = 71.7721, z1 = b. De acuerdo a las reglas 1, 2 y 3, una de las tres ramas
que inician (k = 0) en los puntos s = 35.7377, s = 36.5040, s = 71.7721
(polos de lazo abierto) debe terminar (k = +) en el cero de lazo abierto
colocado en s = b. Por tanto, existiran dos ramas del lugar de las races que
tienden a algun punto del infinito sobre el plano s. De acuerdo a la regla 3,
los angulos de las asntotas a las que tienden estas ramas son:

180 (2 0 + 1) 180 (2 0 + 1)
= = 90
nm 31
Ademas, de acuerdo a la regla 4 la ubicacion de estas asntotas sobre el eje
real puede ser ajustada usando el cero en s = b:

p1 + p2 + p3 (b) 35.7377 36.5040 71.7721 + b


a = = (5.54)
nm 2
Notese que b debe ser positivo pues de otra manera una rama del lugar de las
races sera halado hacia el semiplano derecho generando polos de lazo cerrado
inestables. Notese tambien que las asntotas se mueven hacia la izquierda
(mayor estabilidad) conforme el cero es ubicado mas cerca del origen, es decir
conforme b tiende a cero. Todo esto significa que existe un lmite en cuanto
a que tan a la izquierda se pueden colocar los polos complejos conjugados de
lazo cerrado.
De acuerdo a la regla 5 ahora existira lugar de las races sobre dos seg-
mentos del eje real porque ahora se tienen cuatro polos y ceros reales de lazo
abierto. La ubicacion de dichos segmentos sobre el eje real depende del va-
lor de b usado, como se muestra en las figuras 5.27(a) y 5.27(b). Mas aun,
en la figura 5.27(c) se muestra que si se selecciona b = 36.5040 entonces se
cancela el cero de lazo abierto en s = b con el polo de lazo abierto ubicado
s = 36.5040. Esto significa que, en tal caso, solo existira lugar de las races
en un segmento del eje real.
En la figura 5.27(c) se aprecia que solo existen dos polos de lazo cerrado.
En las figuras 5.27(a) y 5.27(b) se puede apreciar que existen tres polos de
lazo cerrado y que uno de esos polos estara en el semiplano complejo dere-
cho (inestabilidad en lazo cerrado) si la ganancia k es demasiado pequena. Por
otro lado, si k es demasiado grande se tendran dos polos complejos conjugados
con parte imaginaria demasiado grande, por lo que la respuesta oscilara rapi-
damente. Aunque en teora esto puede funcionar porque los tres polos tienen
parte real negativa, sin embargo un valor grande de k hace que se sature el
amplificador de potencia por lo que el sistema de control no podra funcionar
satisfactoriamente en la practica. As que un buen diseno sera aquel que per-
mita obtener los polos de lazo cerrado deseados usando una ganancia k que
no sea ni muy grande ni muy pequena.
Suponga que se desean los siguientes polos complejos conjugados de lazo
cerrado s = 25 j40. A continuacion se presenta la manera de calcular los
262 5 Diseno usando la respuesta en el tiempo

(a) b = 31.24 < 36.50


Root Locus
150

100

50
Imaginary Axis

0
b

-50

-100

-150
-80 -60 -40 -20 0 20 40
Real Axis

(b) b > 36.50


Root Locus
2

1.5

0.5
Imaginary Axis

0
b

-0.5

-1

-1.5

-2
-80 -60 -40 -20 0 20 40
Real Axis

(c) b = 36.50

Figura 5.27. Lugares de las races para G(s)H(s) definida en (5.50) obtenidos al
cambiar el valor de b.
5.2 Ejemplos 263

Im (s )

25 + j40

l3
l2 l1
l4
3 2 4 1

71:7 36:5 b 35:7 Re (s )

Figura 5.28. Polos y ceros de lazo abierto para ubicar los polos deseados de lazo
cerrado en s = 25 j40.

valores exactos de b y de k que permiten conseguir estos polos de lazo cerrado.


De acuerdo a la figura 5.28 se calculan los siguientes angulos:

40
3 = arctan
71.7721 25

40
2 = arctan
36.5040 25

40
1 = 1800 arctan
35.7377 + 25
Usando la condicion de angulo (5.52) se calcula 4 y con esto el valor de b:
4 = 1800 + (1 + 2 + 3 )
40
b= + 25 = 31.2463
tan(4 )
Por otro lado, de acuerdo a la figura 5.28 se calculan las siguientes longitudes:
p
l4 = 402 + (b 25)2
p
l3 = 402 + (71.7721 25)2
p
l2 = 402 + (36.5040 25)2
p
l1 = 402 + (35.7377 + 25)2
con las que finalmente se usa la condicion de magnitud (5.53) para calcular k:
l1 l2 l3
k= = 0.0396
116137 l4
La ubicacion del tercer polo de lazo cerrado se puede encontrar de la condicion
1 + G(s)H(s) = 0 usando G(s)H(s) dada en (5.50) as como b = 31.2463 y
k = 0.0396 es decir:
264 5 Diseno usando la respuesta en el tiempo

116137(s + 31.2463)
1 + 0.0396 =0 (5.55)
s3 + 72.54s2 1250s 9.363 104
de donde:

s3 + 72.54s2 + (0.0396 116137 1250)s


+(0.0396 116137 31.2463 9.363 104 ) = 0

Las races de este polinomio son los polos de lazo cerrado conseguidos con
b = 31.2463 y k = 0.0396. Usando un programa de computadora se encuentra
que estas races son 25.0037 + j39.9630, 25.0037 j39.9630 y 22.5326.
Estos polos tambien son mostrados en la figura 5.27(a) usando signos +.
Notese que se han conseguido los polos complejos conjugados deseados y el
tercer polo, el cual es real, tambien esta colocado en el semiplano complejo
izquierdo, es decir, se ha conseguido estabilidad en lazo cerrado. Recuerdese
que el factor k(s + b) representa un controlador proporcional-derivativo.
Es importante mencionar que este sistema de control es utilizado para
regular la salida en un valor deseado igual a cero. Esto implica que indepen-
dientemente del tipo del sistema la salida deseada sera alcanzada . As que no
es necesaria ninguna consideracion respecto a la respuesta en estado estacio-
nario.
En la figura 5.29 se muestra la respuesta en lazo cerrado (lnea continua)
ante una entrada cero, r = 0 (vease la figura 5.1). Se usa (5.50), b = 31.2463
y k = 0.0396. Tambien se muestra, con lnea interrumpida, la respuesta de
2
un sistema cuya funcion de transferencia es s2 +2nn s+2 cuyos polos estan
n
ubicados en s = 25 j40. Por tanto, este sistema representa el modelo de
referencia pues su respuesta posee las caractersticas deseadas de la respuesta
transitoria. Ambas respuestas inician a partir de un valor de salida igual a
2.85. Notese que ambas respuestas son parecidas. Sin embargo, las diferencias
existentes entre ellas se deben al cero en s = 31.2463 y al polo de lazo
cerrado en s = 22.5326, los cuales no estan suficientemente cerca como para
que sus efectos sean cancelados completamente.

5.2.7. Control proporcional-integral-derivativo (PID) de un


sistema de levitacion magnetica

En esta seccion se presenta la manera de usar el lugar de las races para


seleccionar las ganancias de un controlador PID para el sistema de levitacion
magnetica que se construye y se prueba experimentalmente en el captulo 11.
La funcion de transferencia de lazo abierto es la siguiente:
k
!
11613700 kd s2 + kdp s + kkdi
G(s)H(s) = 3 (5.56)
s + 2739s2 1250s 3.536 106 s

donde kd es el parametro que vara el metodo desde 0 hasta + para dibujar


k
el lugar de las races, mientras que los valores de kdp y kkdi deben ser propuestos.
5.2 Ejemplos 265

2.5

1.5

0.5

0.5
0 0.05 0.1 0.15 0.2 0.25

Figura 5.29. Respuesta en lazo cerrado del sistema (5.50) a partir de una condicion
inicial diferente de cero. Lnea continua: respuesta disenada. Lnea interrumpida:
respuesta deseada. Eje vertical: y[m]. Eje horizontal: tiempo en segundos.

En el captulo 11 se explica que se utiliza un controlador PID para asegurar que


se alcanza la posicion deseada (constante) aun cuando exista incertidumbre en
el peso de la bola a levitar. Notese que el controlador PID introduce dos ceros
de lazo abierto. Usando software especializado se encuentra que los cuatro
polos de lazo abierto estan colocados en:

s1 = 35.9, s2 = 2739.4, s3 = 35.9, s4 = 0

Usando la regla 3 se encuentra que existen n m = 4 2 = 2 ramas del lugar


de las races que tienden al infinito en el plano s siguiendo asntotas cuyos
angulos estan dados como:
180
= 90
2
Ademas, de acuerdo a la regla 4, el punto sobre el eje real donde estas asntotas
se intersectan es:
35.9 2739.4 35.9 + z1 + z2
a =
2
donde z1 < 0 y z2 < 0 son las partes reales de los dos ceros de lazo abier-
to introducidos por el controlador PID (estos valores deben ser propuestos).
Es claro que a se mueve hacia la izquierda (lo que implica que el sistema de
266 5 Diseno usando la respuesta en el tiempo

lazo cerrado se hace mas estable) si z1 < 0 y z2 < 0 se eligen cercanos


a cero. Notese que esto esta de acuerdo con la regla 12. A partir de esto se
concluye que a < 1100 esta colocado muy a la izquierda del origen. Usando
estas observaciones, as como las reglas 1, 2, 5 y 6 se encuentra que existen
las tres posibilidades mostradas en la figura 5.30 para el lugar de las races de
este problema.
Si se conociera la ubicacion de los polos de lazo cerrado que resultan en
un buen desempeno experimental del sistema en lazo cerrado, se podra pro-
ceder como en la seccion 5.2.6 para determinar la ubicacion adecuada de los
ceros de lazo abierto (introducidos por el controlador PID). Sin embargo, este
no es el caso de este problema y por ello el principal objetivo del diseno es
simplemente conseguir que el sistema en lazo cerrado sea estable. Como ya
se menciono, es preferible que los dos ceros de lazo abierto esten colocados
cerca del origen. Esto significa que es preferible que el lugar de las races ten-
ga la forma mostrada en la figura 5.30(a). Por otro lado, dos ceros complejos
forzaran la existencia de polos complejos conjugados de lazo cerrado, lo cual
resulta en un sistema menos amortiguado (mas difcil de estabilizar). Por esta
razon, tambien se desecha el lugar de las races de figura 5.30(c). Por tanto,
buscando obtener el lugar de las races de la figura 5.30(a) se proponen los
siguientes valores:
kp ki 31.24
= 31.24, = (5.57)
kd kd 0.8
pues esto coloca los dos ceros de lazo abierto en:
s5 = 29.9355, s6 = 1.3045
es decir, estan colocados entre los polos de lazo abierto ubicados en:
s3 = 35.9, s4 = 0
Notese que el hecho de que a < 1100 esta colocado muy a la izquierda del
origen y que las asntotas forman angulos de 90 asegura que existe un valor
mnimo de kd a partir del cual todos los polos de lazo cerrado estan colocados
en el semi plano complejo izquierdo. Usando los valores numericos en (5.57)
se utiliza el criterio de Routh para encontrar que:
kd > 0.01 (5.58)
asegura que todos los polos de lazo cerrado estan colocados en el semi plano
complejo izquierdo y que el sistema en lazo cerrado es estable. Esto se hace
del siguiente modo. De la condicion 1 + G(s)H(s) = 0 (es decir, usando (5.56)
y (5.57)) se obtiene el polinomio caracterstico:
s4 + a3 s3 + a2 s2 + a1 s + a0 = 0 (5.59)
a3 = 2739, a2 = 11613700 kd 1250,
a1 = 11613700 31.24 kd 3.536 106 ,
31.28
a0 = 11613700 kd
8
5.2 Ejemplos 267

Im(s)

a Re(s)

(a)
Im(s)

a Re(s)

(b)

Im(s)

a Re(s)

(c)

Figura 5.30. Diferentes posibilidades para el lugar de las races del control PID de
un sistema de levitacion magnetica.
268 5 Diseno usando la respuesta en el tiempo

Para aplicar el criterio de Routh se construye la tabla 5.1. Para que haya

Tabla 5.1. Aplicacion del criterio de Routh al polinomio en (5.59).


s4 1 a 2 a0
s3 a3 a1 0
s2 a3 a2 a1
a3
= e a0 0
s1 ea1 a3 a0
e
0
s0 a0

estabilidad en lazo cerrado se requiere que no haya cambios de signo en la


primera columna de la tabla 5.1, es decir que:
a3 a2 a1 ea1 a3 a0
> 0, > 0, a3 > 0, a0 > 0 (5.60)
a3 e
Notese que la tercera condicion en (5.60) se satisface de manera natural mien-
tras que de la primera y la ultima condiciones se encuentra que:

kd > 3.5695 106 , kd > 0 (5.61)

De la segunda condicion en (5.60) se obtiene:



2 b1 b3 2 b5 b1 b3
kd + 2739 kd >0 (5.62)
b2 b4 b2 b4 b2 b4
b1 = 112250, b2 = 3.1447 1010 , b3 = 3.536 106 ,
31.28
b4 = 11613700 31.24, b5 = 11613700
8
Dado que se trata de un polinomio de segundo grado, no es difcil encontrar
que las races del polinomio en (5.62) son kd = 0.01 y kd = 3.5 106 . Mas
aun, se puede evaluar numericamente para encontrar que:

(kd 0.01)(kd + 3.5 106 ) > 0, si kd < 3.5 106


(kd 0.01)(kd + 3.5 106 ) < 0, si 3.5 106 < kd < 0.01
(kd 0.01)(kd + 3.5 106 ) > 0, si kd > 0.01

Por tanto, para satisfacer simultaneamente (5.61) y (5.62) y asegurar estabili-


dad en lazo cerrado, se debe seleccionar (5.58). En el captulo 11 se usan estos
resultados para proponer varios conjuntos de ganancias para el controlador
PID que son probados experimentalmente.

5.2.8. Control de un sistema ball and beam

En esta seccion se disena un controlador para el sistema ball and beam


que se construye y prueba experimentalmente en el captulo 12, seccion 12.7.
5.2 Ejemplos 269

Inicialmente suponga que se usara un controlador proporcional de ganancia .


Lo primero que se procede a hacer es estudiar la posibilidad de que el sistema
en lazo cerrado pueda ser estable para algun valor positivo de la ganancia
(los otros parametros tambien son positivos pero no se pueden cambiar). El
diagrama de bloques en lazo cerrado correspondiente se muestra en la figura
5.31. La funcion de transferencia de lazo cerrado es:

Xd (s) k X(s)
Ax
+ s ( s+ a ) s2

Figura 5.31. Sistema en lazo cerrado. Control proporcional de ganancia .

X(s) Ax k
= 4
Xd (s) s + as3 + Ax k
Ax = 5.3750, k = 16.6035, a = 3.3132, =5
La estabilidad del sistema en lazo cerrado se estudia usando el criterio de
Routh. Para ello se construye la tabla 5.2 usando el polinomio caracterstico
de lazo cerrado s4 + as3 + Ax k. Notese que un elemento de la primera

Tabla 5.2. Aplicacion del criterio de Routh al polinomio s4 + as3 + Ax k.


s4 1 0 Ax k
s3 a 0 0
s2 0 Ax k
s1 aA

x k
0
0
s Ax k

columna es igual a cero por lo que, de acuerdo al metodo, debe ser sustituido
por un valor > 0 pequeno. Notese que bajo esta condicion, existen dos
cambios de signo en la primera columna de la tabla 5.2 y que esto no puede
ser modificado ajustando el valor de (positivo). Entonces, se concluye que
no existe ningun controlador proporcional que pueda hacer que el sistema en
lazo cerrado sea estable y debe intentarse con otro controlador.
De acuerdo a la regla 12 de la seccion 5.1.1 un controlador PD hace mas
estable aquello que no lo es, porque un controlador PD introduce un cero de
lazo abierto. Sin embargo, un controlador PD amplifica el ruido debido a su
parte derivativa. Esto se ve claramente en el captulo 6 porque un contro-
lador PD es un filtro pasa altas y el ruido es una senal de alta frecuencia.
270 5 Diseno usando la respuesta en el tiempo

Una manera de conseguir las propiedades estabilizantes de un controlador PD


pero disminuyendo un poco el efecto del ruido es usando un compensador de
adelanto de la forma s+
s+c con c > > 0. Por esta razon, a continuacion se
estudia la posibilidad de estabilizar el sistema en cuestion usando el diagrama
de bloques mostrado en la figura 5.32. La funcion de transferencia de lazo

Xd (s) k X(s)
Ax s+
s+ c s ( s+ a ) s2
+

Figura 5.32. Sistema en lazo cerrado. Uso de un compensador de adelanto.

cerrado es:
X(s) Ax k(s + )
= 5
Xd (s) s + (a + c)s4 + acs3 + Ax ks + Ax k
La estabilidad del sistema en lazo cerrado se estudia usando el criterio de
Routh. Para ello se construye la tabla 5.3 usando el polinomio caracterstico
de lazo cerrado s5 + (a + c)s4 + acs3 + Ax ks + Ax k. Notese que, dado que

Tabla 5.3. Aplicacion del criterio de Routh al polinomio s5 + (a + c)s4 + acs3 +


Ax ks + Ax k.
s5 1 ac Ax k
s4 a+c 0 Ax k
(a+c)Ax kAx k
s3 ac a+c
=e
s2 (a+c)e
ac
=f Ax k
s1 f eacAx k
f
0
s0 Ax k

todos los parametros son positivos, hay al menos dos cambios de signo en la
primera columna de la tabla 5.3. Entonces, se concluye que no existe ningun
compensador de adelanto que pueda hacer que el sistema en lazo cerrado sea
estable y debe intentarse otra estrategia de control. Analizando cuidadosa-
mente la tabla 5.3 se encuentra que el problema es originado por el primer
elemento correspondiente al renglon s2 , es decir (a+c)e
ac , el cual es negativo.
Notese que esto es una consecuencia de que el segundo elemento correspon-
diente al renglon s4 es igual a cero. Esto es debido a que la potencia s2 tiene
un coeficiente cero en el polinomio s5 + (a + c)s4 + acs3 + Ax ks + Ax k.
5.2 Ejemplos 271

Por tanto, se concluye que el sistema en lazo cerrado puede ser estable si el
polinomio caracterstio de la funcion de transferencia de lazo abierto tiene la
potencia s2 con un coeficiente positivo. A continuacion se muestra que esto es
posible si se usan dos lazos internos como se muestra en la figura 5.33. Notese
que se sigue manteniendo el uso del compensador de adelanto. En este caso,

Xd (s) s+ b + + k X(s)
Ax s+ c

s ( s+ a )
s2
+ 1 2

k s A

Figura 5.33. Sistema en lazo cerrado. Uso de lazos internos y un compensador de


adelanto.

la funcion de transferencia de lazo abierto esta dada como:


Ax s + b kA 1
G(s)H(s) =
A s + c s2 + (a + kv kA )s + kA s2
c > b > 0, > 0, A = 0.9167

Notese que el sistema es tipo 2, por lo que el error en estado estacionario es


cero si la referencia deseada es una constante o una rampa. El lector pue-
de obtener la funcion de transferencia de lazo cerrado XX(s) d (s)
para verificar
que el polinomio caracterstico correspondiente es de grado 5 y con todos los
coeficientes de sus potencias positivos (incluido el coeficiente de s2 ), como se
esperaba. De acuerdo a la discusion previa, esto significa que existe la posibili-
dad de encontrar valores positivos para , c, b (con c > b), kv y que consigan
que el sistema en lazo cerrado sea estable. A continuacion se encuentran estos
valores usando el metodo del lugar de las races.
Suponga que las races del polinomio s2 + (a + kv kA )s + kA son com-
plejas conjugadas, es decir, que se puede escribir:

s2 + (a + kv kA )s + kA = (s + + j)(s + j), > 0, >0

De acuerdo a la regla 3 existen n m = 4 ramas del lugar de las races que


tienden hacia el infinito del plano s sobre cuatro asntotas cuyos angulos estan
dados como:
180
= 45
4
180 (3)
= 3(45 ) = 135
4
Por tanto, usando estos resultados as como las reglas 1,2 y 5, se concluye que
272 5 Diseno usando la respuesta en el tiempo

Im(s)

x

x x
+
c b Re(s)

(a)

Im(s)

x
x +
x
c b Re(s)
x

(b)

Im(s)

x x
+
b Re(s)
c
x

(c)

Figura 5.34. Diferentes posibilidades para el lugar de las races de un sistema ball
and beam.
5.2 Ejemplos 273

existen las posibilidades mostradas en la figura 5.34. De acuerdo a la regla 4,


el punto donde se intersectan las asntotas mencionadas anteriormente con el
eje real esta dado como:
2 + (b c)
a =
4
Esto significa que las 4 ramas son haladas hacia la izquierda (por lo que el
sistema en lazo cerrado tiende a ser mas estable) si:
Se elige un valor mayor de > 0, es decir, si el sistema:
kA
(5.63)
s2 + (a + kv kA )s + kA
esta suficientemente amortiguado, lo cual se consigue usando un valor su-
ficientemente grande de la ganancia kv > 0.
b > 0 se aproxima a cero y c > 0 es grande, es decir si c > b. Notese que
esto esta en completo acuerdo con las reglas 11 y 12.
Siguiendo la segunda opcion se obtiene el diagrama del lugar de las races
mostrado en la figura 5.34(b). Notese que las dos ramas que inician en los dos
polos colocados en s = 0 siempre permanecen sobre el semiplano complejo
derecho, lo cual implica que el sistema en lazo cerrado es inestable. La principal
razon para este comportamiento es que las ramas que inician en los polos de
la funcion de transferencia en (5.63) son halados hacia el segmento sobre
el eje real entre s = c y s = b. Esto, a su vez, se debe a que los dos
polos complejos de lazo abierto estan muy cerca del segmento entre s = c
y s = b. Si dichos polos complejos se alejan de dicho segmento entonces se
abre la posibilidad de que las dos ramas que inician en los polos colocados en
s = 0 sean haladas hacia el segmento entre s = c y s = b para obtener
el diagrama mostrado en la figura 5.34(c). Esto implica que hay estabilidad
en lazo cerrado para algunos valores pequenos de la ganancia de lazo. Para
conseguir esto, es necesario usar valores grandes del coeficiente kA (esto
incrementa la distancia al origen de los polos complejos de lazo abierto arriba
mencionados), es decir, usando un valor grande de .
La discusion anterior indica que se deben usar valores grandes de kv y
. Sin embargo, en la practica estos valores estan limitados por el contenido
de ruido del sistema, por lo que kv y deben ser obtenidos usando pruebas
experimentales. De hecho, el ruido tambien es una razon importante para no
seleccionar reales los polos de la funcion de transferencia en (5.63): obtener
polos reales implica un sistema muy amortiguado lo cual requiere un valor
de kv aun mayor. De acuerdo a las pruebas experimentales reportadas en el
captulo 12 se seleccionaron los siguientes valores:
= 12, kv = 0.2
Por tanto, los unicos valores que falta determinar son , c y b. Aunque estos
parametros se pueden determinar de manera que los polos de lazo cerrado
274 5 Diseno usando la respuesta en el tiempo

sean asignados en los valores deseados (usando la metodologa presentada


en la seccion 5.2.6), sin embargo en este problema no se conoce cual es la
ubicacion de los polos de lazo cerrado que resultan en un buen desempeno.
Por esta razon, el objetivo de diseno es simplemente que el sistema en lazo
cerrado sea estable. Para conseguir esto se procede del siguiente modo.
Se proponen valores para b y c de modo que c > b > 0.
Se hace uso de software especializado para dibujar el lugar de las races.
Se elige un valor de > 0 para el cual todos los polos de lazo cerrado
esten ubicados en el semi plano complejo izquierdo. Esto significa que es
el parametro usado por el metodo para dibujar el lugar de las races.
Si no existe tal valor de > 0 se regresa al primer paso.
De este modo se obtiene el lugar de las races de la figura 5.35 donde se
observa que todos los polos de lazo cerrado (marcados con el smbolo +)
tienen parte real negativa si se usa:

= 1.2, c = 20, b = 2.5

Finalmente, es conveniente decir que se debe incluir un paso adicional para el


procedimiento arriba listado:
Una vez seleccionados los valores de , c y b se deben realizar pruebas
experimentales para verificar que se obtiene un buen desempeno con el
sistema de control disenado. Si no es as, entonces regrese de nuevo al
primer paso del procedimiento arriba listado.

Root Locus

15

10

5
Imaginary Axis

10

15

20 15 10 5 0
Real Axis

Figura 5.35. Lugar de las races del sistema ball and beam disenado.
5.3 Caso de estudio 275

5.3. Caso de estudio. Notas adicionales sobre el control


PID de posicion de un motor de CD
En la seccion 5.2.5 se estudia el uso de un controlador PID para regular
la posicion de un motor de CD. Ah se encontro que la posicion del motor se
relaciona con la posicion deseada y la perturbacion externa de par, a traves
de dos funciones de transferencia que, sin embargo, tienen el mismo polinomio
caracterstico:

s3 + (a + kd k)s2 + kp ks + ki k (5.64)

Tambien se encontro que si se desean asignar los siguientes polos de lazo


cerrado p1 , p2 , p3 :

p1 = 1 + j1 , p2 = 1 j1 , p3 < 0, 1 < 0, 1 > 0

entonces las ganancias del controlador se deben seleccionar de acuerdo a


(5.40), es decir:

(21 + p3 ) a
kd = >0 (5.65)
k
2 + 12 + 21 p3
kp = 1 >0 (5.66)
k
p3 (12 + 12 )
ki = >0 (5.67)
k
Por otro lado, en el ejemplo 4.12, del captulo 4, se encontro que todas las
races del siguiente polinomio:

s3 + as2 + bs + c

tienen parte real negativa si y solo si:


c
a > 0, b> >0 c>0
a
Aplicando estas condiciones al polinomio caracterstico dado en (5.64) se ob-
tiene:
ki k
a + kd k > 0, kp k > , ki k > 0 (5.68)
a + kd k
Usando las expresiones en (5.65), (5.66), (5.67) y (5.68) se puede concluir que
las ganancias de un controlador PID de posicion para un motor de CD tienen
los siguientes efectos sobre la respuesta del sistema en lazo cerrado:
Valores mayores y positivos de la ganancia integral, ki , resultan en una
respuesta mas rapida y que oscila cada vez mas. La primera parte de esta
observacion se justifica a partir de (5.67), donde n2 = 12 + 12 , recordando
276 5 Diseno usando la respuesta en el tiempo

que dos polos complejos conjugados producen una respuesta mas rapida si
n es mayor y que un polo real y negativo, p3 < 0, produce una respuesta
mas rapida si su valor absoluto, p3 , es mayor. La segunda parte de la
observacion se justifica a partir de la segunda desigualdad en (5.68), es
ki k
decir kp k > a+k dk
. Si ki es mayor, entonces esta condicion tiende a no ser
valida, es decir, el sistema en lazo cerrado se acerca a la inestabilidad y
por eso oscila cada vez mas.
Valores mayores y positivos de la ganancia proporcional, kp , resultan en
una respuesta mas rapida cuyas oscilaciones, al menos, no se incrementan
de manera importante. La primera parte de esta observacion se justifica a
partir de (5.66) usando argumentos similares a los de la ganancia integral
en el parrafo anterior: recordando que n2 = 12 + 12 , 1 p3 > 0, que dos
polos complejos conjugados producen una respuesta mas rapida si n es
mayor y que un polo real y negativo, p3 , produce una respuesta mas rapi-
da si su valor absoluto es mayor. La segunda parte de la observacion se
justifica, de nuevo, a partir de la segunda desigualdad en (5.68), es decir
ki k
kp k > a+k dk
. Si kp es mayor, entonces esta condicion es cada vez mas vali-
da, es decir, el sistema en lazo cerrado se hace cada vez mas estable. Sin
embargo, esto, unido al incremento en la rapidez (que en general tiende
a aumentar las oscilaciones de la respuesta), puede resultar en un com-
portamiento transitorio donde, al menos, las oscilaciones no aumentan de
manera importante.
Valores mayores y positivos de la ganancia derivativa, kd , producen una
respuesta que oscila menos. Esta observacion se justifica a partir de la
ki k
segunda desigualdad en (5.68), es decir kp k > a+k dk
. Notese que si kd > 0
es mayor, entonces esta condicion es mas valida y, por tanto, el sistema en
lazo cerrado es mas estable. As, un valor mayor de kd > 0 puede reducir las
oscilaciones debidas a un valor grande de ki > 0. Por otro lado, a partir de
(5.65) se concluye que valores mayores de kd > 0 producen valores mayores
de 1 > 0 y/o de p3 > 0. Usando este hecho, junto con (5.66), (5.67), y
si kp y ki se mantienen constantes, se concluye que si n2 = 12 +12 aumenta
(o disminuye), al variar 1 , entonces p3 disminuye (o aumenta) por lo
que la rapidez de respuesta no se ve claramente afectada. Sin embargo,
en la pratica es comun encontrar que al aumentar kd > 0 la rapidez de
respuesta del sistema en lazo cerrado disminuye un poco.
Es conveniente advertir que la funcion de transferencia entre la posicion y
su valor deseado (G1 (s) en (5.37)) tiene dos ceros cuyo efecto sobre la respuesta
transitoria no es del todo clara. As que es posible que en algunas ocasiones
existan algunas variaciones respecto de los efectos que se acaban de mencionar
para las ganancias de un controlador PID. Ademas, estas variantes pueden ser
favorecidas por el hecho de que en algunos mecanismos la perturbacion externa
esta presente desde que se ordena un nuevo valor deseado de posicion.
Para ilustrar mejor estas ideas, a continuacion se presentan los resultados
obtenidos de manera experimental al controlar la posicion de un motor de
5.3 Caso de estudio 277

CD. El prototipo experimental es el mismo que se describe en el captulo 10


con una variante adicional (no presente en dicho captulo): la flecha del motor
se une firmemente a un pendulo como el mostrado en la figura 5.36. De este
modo, y por efecto de la gravedad g, se introduce una perturbacion de par
que trata de desviar la posicion del motor respecto de su valor deseado. En la
figura 5.36, T (t) representa el par generado por el motor y es la variable que
se controla. Los parametros del pendulo l y m no se miden para mostrar que se
puede sintonizar un controlador PID sin necesidad de conocer los parametros
de la planta, si se entienden cuales son los efectos de las ganancias de un
controlador PID (listados mas arriba).

T(t)

l

g
m

Figura 5.36. Pendulo simple que se conecta a la flecha de un motor de CD.

En las figuras 5.37 y 5.38 se muestran los resultados experimentales corres-


pondientes. Se usa el valor deseado de posicion d = /2[rad] pues es ah donde
la perturbacion de par debida a la gravedad tiene su mayor efecto. Ademas se
muestra una lnea vertical ubicada en t = 0.13[s] y una lnea horizontal ubica-
da en = 1.8[rad] para indicar el tiempo de subida y el sobre paso deseados.
La intencion es variar un parametro a la vez con el fin de apreciar claramente
su efecto. De este modo, las curvas dibujadas en la figura 5.37 corresponden
a los siguientes parametros de controlador PID:
1. Grafica superior:
Lnea contnua: kp = 0.5, ki = 0, kd = 0.
Lnea-punto: kp = 1, ki = 0, kd = 0.
Lnea punteada: kp = 1, ki = 0, kd = 0.05.
2. Grafica inferior:
Lnea contnua: kp = 1, ki = 2, kd = 0.05.
Lnea-punto: kp = 1, ki = 5, kd = 0.05.
Lnea punteada: kp = 2, ki = 5, kd = 0.05.
Lnea interrumpida: kp = 2, ki = 5, kd = 0.1.
Como el sistema en lazo cerrado es de tercer orden cuando se usa un con-
trolador PID y, ademas, no se conocen los parametros del motor a controlar,
278 5 Diseno usando la respuesta en el tiempo

es difcil saber que ganancias del controlador hay que utilizar para evitar la
inestabilidad. As que lo mejor es iniciar con un controlador PD (asignando
ki = 0), que produce un sistema en lazo cerrado de segundo orden el cual es
estable para cualquier valor positivo de kp con kd = 0 (pues todo mecanismo
real posee un poco de friccion). Posteriormente, de acuerdo a la respuesta
transitoria que se vaya obteniendo y a las reglas de sintona arriba listadas,
se podra empezar a ajustar las ganancias ki y kd de manera que se consigan
respuestas estables. Por esta razon, en la parte superior de la figura 5.37 se
utiliza un controlador PD. Notese que se obtiene un error en estado esta-
cionario diferente de cero debido a la perturbacion de par que introduce la
gravedad (porque ki = 0). En esta parte del experimento, la idea es acercar
la rapidez del sistema a la rapidez deseada asegurando un comportamiento
suficientemente estable. Por esta razon, primero se incrementa la ganancia
proporcional hasta kp = 1 y luego se incrementa la ganancia derivativa has-
ta kd = 0.05. De este modo, en la parte inferior de la figura 5.37, se puede
introducir el termino integral que aunque lleva a cero el error en estado es-
tacionario produce respuestas mas oscilatorias. De nuevo, la idea es tratar de
aproximarse a la rapidez de respuesta deseada. Esto se consigue incrementan-
do primero la ganancia integral hasta ki = 5. Como esto tambien incrementa
las oscilaciones, posteriormente se usa kp = 2 consiguiendo mayor rapidez pero
sin aumentar notablemente las oscilaciones. Finalmente, se usa kd = 0.1 para
obtener una respuesta suficientemente amortiguada. Notese que el incremento
de kd reduce un poco la rapidez de la repuesta (tiempo de subida mayor).
Las curvas dibujadas en la figura 5.38 corresponden a los siguientes
parametros de controlador PID:
1. Grafica superior:
Lnea contnua: kp = 2, ki = 5, kd = 0.1.
Lnea-punto: kp = 2, ki = 5, kd = 0.2.
Lnea punteada: kp = 2, ki = 8, kd = 0.2.
2. Grafica inferior:
Lnea contnua: kp = 2, ki = 8, kd = 0.2.
Lnea-punto: kp = 2.5, ki = 8, kd = 0.2.
Lnea punteada: kp = 3, ki = 8, kd = 0.2.
Lnea interrumpida: kp = 3.5, ki = 8, kd = 0.2.
En la grafica superior de la figura 5.38 se observa que la respuesta es aun mas
amortiguada y mas lenta al incrementar la ganancia derivativa de kd = 0.1
a kd = 0.2. Como en este momento la respuesta es muy lenta y el sobre
paso es muy pequeno, se usa ki = 8 para producir un sistema mas rapido
y con un sobre paso mayor que coincide con el sobre paso deseado. Con el
fin de incrementar la rapidez, sin afectar notablemente el sobre paso, en la
parte inferior de la figura 5.38 se incrementa la ganancia proporcional hasta
kp = 3.5. De este modo se consigue la rapidez y el sobre paso deseados.
Es conveniente aclarar lo siguiente. Al conectar un pendulo a la flecha de
un motor de CD, el sistema de control es no lineal. Esto significa que en ciertas
5.3 Caso de estudio 279


[rad]

tiempo[s]

[rad]

tiempo[s]

Figura 5.37. Control PID de posicion de un motor de CD con una carga pendular.
Resultados experimentales.

regiones el comportamiento del sistema de control no es predicho adecuada-


mente por el analisis matematico presentado mas arriba. Por ejemplo, si el
valor deseado de posicion es cercano a d = , un simple control PD puede
ser inestable si la ganancia proporcional (positiva) no es mayor que un cierto
umbral inferior. Este resultado se obtiene usando un controlador PD en el caso
x1 = , x2 = 0 del ejemplo 7.3 estudiado en el captulo 7 y obteniendo los
polos de dicha aproximacion lineal. Tambien pueden consultarse los trabajos
reportados en [4], [2], cap. 8, [3], cap. 7. Esta situacion es mas grave cuando se
trata de un controlador PID pero el problema no aparece si el valor deseado
de posicion se mantiene alejado de d = , situacion que corresponde a los
experimentos aqu presentados.
Finalmente, notese que se ha conseguido seleccionar las ganancias de un
controlador PID de posicion para un motor de CD sin necesidad de conocer el
valor numerico de ningun parametro del motor ni del pendulo. Sin embargo, el
conocimiento mnimo con el que se debe contar para resolver este problema,
desde el punto de vista de construccion del mecanismo, es verificar previa-
mente que el motor puede producir par suficiente. Esto debe incluir el par
necesario para compensar el efecto de la gravedad mas una parte adicional de
par que permita alcanzar la rapidez de respuesta deseada.
280 5 Diseno usando la respuesta en el tiempo


[rad]

tiempo[s]

[rad]

tiempo[s]

Figura 5.38. Control PID de posicion de un motor de CD con una carga pendular.
Resultados experimentales.

5.4. Resumen del captulo

El metodo mas poderoso para el diseno de sistemas de control usando la


respuesta en el tiempo es el lugar de las races. Esto significa que las plantas
a controlar pueden ser sistemas de orden arbitrario con cualquier numero de
ceros. Este metodo provee las herramientas necesarias para determinar, de
manera grafica, la ubicacion de los polos de lazo cerrado a partir de los polos
y ceros de lazo abierto. Algunos de los polos y ceros de lazo abierto son intro-
ducidos por el controlador y la idea del metodo es ajustar la ubicacion de los
polos y ceros del controlador (mediante la seleccion adecuada de sus ganan-
cias) de manera que se consigan los polos de lazo cerrado deseados. Los polos
de lazo cerrado deseados se determinan a partir del conocimiento de como
afectan los polos de una funcion de transferencia a la respuesta transitoria
correspondiente. Para esto es muy importante el estudio previo del captulo
3. Por otro lado, la estructura del controlador se selecciona a partir del co-
nocimiento de como influyen los polos (de lazo abierto) del controlador sobre
la respuesta en estado estacionario del sistema en lazo cerrado. Para esto es
muy importante el estudio previo del error en estado estacionario presentado
en el captulo 4.
5.5 Preguntas de repaso 281

Aunque el lugar de las races ha sido usado como un metodo de diseno


de controladores, tambien es una herramienta poderosa para el analisis de
sistemas de control. Esto significa que se puede utilizar para determinar: i)
que tan estable es un sistema de control, ii) como afecta el cambio de un
parametro a la respuesta del sistema de control, iii) que debe hacerse para
modificar las propiedades del sistema de control, etc. El uso del metodo del
lugar de las races en estas aplicaciones depende en gran medida de un buen
entendimiento del metodo y del conocimiento del material presentado en los
captulos 3 y 4.

5.5. Preguntas de repaso

1. Cuando y para que utilizara cada uno de los siguientes controladores?


Proporcional.
Proporcional-derivativo.
Proporcional-integral.
Proporcional-integra-derivativo.
2. Por que cree que no es recomendable el uso de controladores: i) derivati-
vos, ii) integrales y iii) derivativos-integrales, sin la presencia de la parte
proporcional? Explique.
3. De que manera el error en estado estacionario determina los polos y/o
ceros (la estructura) del controlador?
4. Cual es el componente principal que debe tener un controlador si se desea
mejorar la estabilidad del sistema en lazo cerrado? Cual es el efecto de
esto sobre el lugar de las races?
5. Cual es el componente principal que debe tener un controlador si se desea
mejorar el error en estado estacionario? Cual es el efecto de esto sobre el
lugar de las races?
6. Por que el lugar de las races inicia en los polos de lazo abierto y ter-
mina en los ceros de lazo abierto? Que significan las palabras inicia y
termina?
7. Si la funcion de transferencia de lazo abierto no tiene ceros En donde
termina el lugar de las races?
8. Con frecuencia se dice que al aumentar la ganancia de lazo el sistema en
lazo cerrado tiende a hacerse inestable. Sin embargo, esto no siempre es
cierto pues depende de las caractersticas de la planta que se esta contro-
lando. Revise los ejemplos presentados en este captulo y de un ejemplo
de una planta a controlar que requiera que la ganancia de lazo sea sufi-
cientemente grande para que el sistema en lazo cerrado sea estable.
9. Que es un compensador de adelanto, cual es su principal caracterstica y
para que se usa?
10. Consulte la seccion 9.8 del captulo 9, las secciones 10.2.2 y 10.5 del captu-
lo 10 y la seccion 8.2 del captulo 8 para explicar como construira un con-
282 5 Diseno usando la respuesta en el tiempo

trolador PID y un compensador de adelanto usando software y electronica


analogica.

5.6. Ejercicios propuestos


1. Considere el sistema de control de la figura 5.39 donde:
k = 35.2671, a = 3.5201, c = 10.3672, = 2.0465, d = 3.8935
Verifique que cuando ki = 0 y kp = 1 hay dos polos complejos conjugados
de lazo cerrado en s = 4.8935 j6.6766. Con la ayuda de algun software
especializado, obtenga el lugar de las races para los siguientes valores de
ki :
ki = 0.001, 0.01, 0.1, 1, 10
Use el valor de kp como la ganancia que el metodo vara desde 0 hasta +
para dibujar el grafico. Seleccione el valor de kp = 1 y observe que pasa con
los polos de lazo cerrado correspondientes con respecto a los puntos s =
4.8935j6.6766. Utilice software especializado para realizar simulaciones
en cada caso cuando la referencia es un escalon unitario. Compare la
respuesta obtenida conforme ki crece con la respuesta obtenida cuando
kp = 1 y ki = 0. Elabore los lugares de las races correspondientes usando
el metodo propuesto en este captulo y explique lo que sucede.

d ( s) + k (s)
k
kp + si s+d
s+c s(s+a)

Figura 5.39. Controlador PI en cascada con una red de adelanto.

2. Considere la siguiente planta:


k
Y (s) = H1 (s)U (s), H1 (s) = , k = 35.2671, a = 3.5201
s(s + a)
a) Utilice las expresiones en (3.59) del captulo 3 para obtener los valores
de kp y kv que consigan las siguientes caractersticas de respuesta
transitoria:
tr = 0.33[s], Mp ( %) = 10
cuando yd es un escalon unitario (constante igual a uno) y se utiliza
la siguiente entrada: u(t) = kp (yd y) kv y, control proporcional con
realimentacion de velocidad.
5.6 Ejercicios propuestos 283

b) Considere que la entrada esta dada como:


d(yd y)
u(t) = kp (yd y) + kd , control proporcional-derivativo
dt
Obtenga la funcion de transferencia de lazo cerrado y use las expre-
siones en (3.59) del captulo 3 para determinar kp y kd de manera que
los polos de lazo cerrado se ubiquen en lugares tales que determinen
las siguientes carctersticas de lazo cerrado:
tr = 0.33[s], Mp ( %) = 10
Haga simulaciones para cada uno de los incisos anteriores y compare las
respuestas obtenidas. A que se debe la diferencia existente entre estas
respuestas? Los ceros de una funcion de transferencia pueden afectar la
forma exacta de la respuesta? Puede usar el lugar de las races para
explicar esta diferencia?
3. Considere un sistema en lazo cerrado como el de la figura 5.1 con H(s) = 1
y G(s) = s3 +s21+s+1 .
Usando las reglas presentadas en la seccion 5.1.1 construya el lugar de
las races correspondiente a un controlador proporcional. Compruebe
que el sistema en lazo cerrado es inestable para cualquier valor positivo
de la ganancia del controlador proporcional. Use el criterio de Routh
como alternativa para encontrar este resultado.
Con el fin de estabilizar el sistema en lazo cerrado y para conseguir un
error cero en estado estacionario ante una referencia tipo escalon disene
un controlador PID del siguiente modo. i) Proponga kd s2 + kp s + ki =
kd (s z1 )(s z2 ), con z1 = 0.5 + 1.3j, z2 = 0.5 1.3j. Usando
las reglas presentadas en la seccion 5.1.1 dibuje el lugar de las races
correspondiente para verificar que no existe ningun valor positivo de la
ganancia derivativa que produzca un sistema en lazo cerrado estable.
ii) Proponga kd s2 +kp s+ki = kd (sz1 )(sz2 ), con z1 = 0.25+1.3j,
z2 = 0.25 1.3j. Usando las reglas presentadas en la seccion 5.1.1
dibuje el lugar de las races correspondiente para verificar que existe un
rango de valores positivos de la ganancia derivativa kd que producen
un sistema en lazo cerrado estable. Utilice el criterio de Routh para
encontrar el rango de valores de kd que consiguen estabilidad en lazo
cerrado.
De acuerdo a lo anterior Como debe seleccionar los ceros de un con-
trolador PID para mejorar la estabilidad del sistema en lazo cerrado?
4. Verifique que la funcion de transferencia del circuito mostrado en la figura
5.40 es:
Vo (s) s+a 1 1 1
= , a= , b= +
Vi (s) s+b R1 C R1 C R2 C
Notese que como b > a esta red electrica puede usarse como un compen-
sador de adelanto.
284 5 Diseno usando la respuesta en el tiempo

+
+ R1
vi vo

R2

Figura 5.40. Compensador de adelanto.

5. Considere la siguiente planta:


4(s + 0.2)
G(s) =
(s + 0.5)(s2 0.2s + 0.3)
Use la tecnica del lugar de las races para disenar un controlador que ase-
gure estabilidad en lazo cerrado y un error cero en estado estacionario
cuando la referencia deseada es un escalon. Se sugiere proponer la ubica-
cion de los polos y ceros del controlador y luego seleccionar la ganancia
de lazo abierto de manera que todos los polos de lazo cerrado pertenezcan
al semiplano complejo izquierdo.
6. Considere el control PD de posicion estudiado en la seccion 5.2.2. Demues-
tre que el valor de la ganancia derivativa kd no afecta al error en estado
estacionario cuando la referencia deseada es una constante.
7. Considere el control PID de posicion estudiado en la seccion 5.2.5. De-
muestre que los valores de las ganancias proporcional kp y derivativa kd
no afectan al error en estado estacionario a pesar de la presencia de una
perturbacion constante cuando la referencia deseada tambien es constante.
En este mismo problema suponga que no existe la parte integral del contro-
lador, es decir que ki = 0. Demuestre que el valor de la ganancia derivativa
kd no afecta al error en estado estacionario a pesar de la presencia de la
perturbacion.
8. Considere el sistema masa-resorte-amortiguador mostrado en la figura 5.41
y modelado en el ejemplo 2.2 del captulo 2. En el ejemplo 3.18 del captu-
lo 3 se explica porque hay un error en estado estacionario diferente de cero
cuando se usa un controlador proporcional de posicion y la posicion de-
seada xd es una constante diferente de cero. Recuerde que la fuerza F (t)
aplicada sobre la masa es la senal entregada por el controlador.
Ahora suponga que se usa un controlador PID de posicion. Encuentre el
error en estado estacionario cuando la posicion deseada xd es un valor
5.6 Ejercicios propuestos 285

constante diferente de cero. Use su experiencia cotidiana para explicar el


porque de su respuesta, es decir, trate de explicar pensando en que pasa
con la fuerza F (t) aplicada sobre la masa y que efecto tiene el resorte
sobre la masa.

K F (t) b
m

Figura 5.41. Sistema masa-resorte-amortiguador.

9. Considere el pendulo simple estudiado en el ejemplo 2.13 del captulo 2 y


mostrado en la figura 5.42. Notese que la gravedad ejerce un par diferente
de cero sobre el pendulo si la posicion angular no es igual a cero. Suponga
que se desea llevar la posicion del pendulo a un valor constante d
igual a 90 . Notese que el par T (t) es la entrada del pendulo. Usando
la experiencia del ejercicio previo, diga que tipo de controlador utilizara
para calcular T (t) de manera que consiga alcanzar a d . Explique por
que. Este problema esta hecho para que razone y no necesita utilizar el
modelo matematico del pendulo. De hecho, dicho modelo matematico es
no lineal y por eso no puede ser analizado usando las tecnicas estudiadas
hasta aqu.

T(t)

l

g
m

d
Figura 5.42. Pendulo simple.
286 5 Diseno usando la respuesta en el tiempo

10. Considere una planta cualquiera G(s) y los siguientes controladores colo-
cados en cascada con G(s):
s+a
Gc (s) = , 0<a<b
s+b
s+c
Gd (s) = , c>d>0
s+d
Gc (s) se conoce como un compensador de adelanto mientras que Gd (s) se
conoce como un compensador de atraso.
Cual es el efecto de cada uno de estos compensadores sobre el error
en estado estacionario ante una referencia escalon?
Cual es el efecto de cada uno de estos compensadores sobre la esta-
bilidad relativa del sistema en lazo cerrado?
Con cual de estos compensadores se relaciona un controlador PI y
con cual un controlador PD? Explique por que.
Como construira con estos dos compensadores un controlador que
tenga caractersticas similares a las de un PID? Explique.
11. En un barco es comun contar con un unico girocompas que indica el rum-
bo actual de barco. Sin embargo, se debe contar con esta informacion en
diferentes puntos del barco por lo que es necesario transmitir esta infor-
macion electronicamente para exhibirla en cada punto del barco donde se
necesita usando un instrumento de aguja. La posicion angular de la aguja
es ajustada con un motor de CD usando la informacion suministrada por
el girocompas como la posicion deseada. Disene un sistema de control en
lazo cerrado de manera que la posicion de la aguja del instrumento siga
fielmente a la orientacion suministrada por el girocompas de acuerdo a las
siguientes especificaciones:
Que ante un cambio tipo escalon de 8 en la orientacion del girocompas,
el error en estado estacionario se reduzca y se mantenga en menos de
1 en 0.3 segundos o menos y que el sobre paso sea menor o igual al
25 %.
Cuando la orientacion del girocompas cambie de acuerdo a una rampa
de 5 por segundo, que el error en estado estacionario sea de 0.3 o
menos.
No existen perturbaciones externas.
Bajo que condiciones de operacion del barco pueden ocurrir estas situa-
ciones? La funcion de transferencia entre el voltaje aplicado al motor y la
posicion de la aguja en grados es:

45.84 105
G(s) =
s(4.4 109 s2 + 308.5 109 s + 3.3 106 )
Sugerencia.
i) En base las especificaciones suministradas decida que controlador de-
bera usar. ii) Usando la primera especificacion determine una zona, en el
5.6 Ejercicios propuestos 287

dominio del tiempo, dentro de la cual debe estar la respuesta del siste-
ma en lazo cerrado. iii) Recuerde que, de acuerdo a la figura 3.10 en el
captulo 3, la respuesta de un sistema de segundo orden esta contenida
dentro de dos envolventes exponenciales que dependen de y de n . Con
esta informacion, usando el amortiguamiento deseado y usando el punto
ii) anterior, determine la zona del plano complejo s dentro de la cual de-
ben caer los polos dominantes (complejos conjugados) del sistema en lazo
cerrado. iv) Determine un punto conveniente sobre la frontera de dicha
zona del plano s y use las reglas vistas para construir el lugar de las races
para determinar las ganancias de un controlador que consiga que dicho
punto sea un polo de lazo cerrado. v) Una vez conseguido esto, seleccio-
ne una ganancia de lazo abierto que asegure que todos los polos de lazo
cerrado esten dentro de la zona deseada. vi) Verifique que se cumple la se-
gunda especificacion y, si no es as, redisene el controlador. vii) Mediante
simulaciones verifique que se satisfacen todas las especificaciones.
Referencias

1. G.W. Evans, The story of Walter R. Evans and his textbook Control-Systems
Dynamics, IEEE Control Systems Magazine, pp. 74-81, December 2004.
2. R. Kelly, V. Santibanez and A. Lora, Control of robot manipulators in joint
space, Springer, London, 2005.
3. R. Kelly y V. Santibanez, Control de movimiento de robots manipuladores, Pear-
son Prentice Hall, Madrid, 2003.
4. R. Kelly, PD control with desired gravity compensation of robotic manipulators:
a review, The International Journal of Robotcs Research, vo. 16, No. 5, pp. 660-
672, 1997.
5. K. Ogata, Ingeniera de Control Moderna, 4a. edicion, Pearson Prentice-Hall,
Madrid, 2003.
6. N.S. Nise, Sistemas de control para ingeniera, 1a. edicion en espanol, 1a. Re-
impresion, CECSA, Mexico, 2004.
7. R.C. Dorf y R.H. Bishop, Sistemas de control moderno, 10a. edicion, Pearson
Prentice-Hall, Madrid, 2008.
8. B.C. Kuo, Sistemas de control automatico, 7a. edicion, Prentice-Hall Hispanoa-
mericana, Mexico, 1995.
9. G.H. Hostetter, C.J. Savant y R.T. Stefani, Sistemas de control, 1a. edicion en
espanol, McGraw-Hill, Mexico, 1992.
10. W. Ali and J.H. Burghart, Effects of lag controllers on the transient response,
IEE Proceedings-D, Control theory and applications, vol. 138, no. 2, pp. 119-122,
March 1991.
6
Diseno usando la respuesta en frecuencia

Uno de los problemas mas importantes y urgentes por resolver durante


la Segunda Guerra Mundial fue el direccionamiento de canones antiaereos.
La solucion de este problema motivo en buena medida el desarrollo del con-
junto de herramientas que hoy conocemos como las tecnicas de respuesta en
frecuencia. Aunque las ideas de Nyquist fueron formuladas un poco antes de
este perodo, las ideas de Bode sobre los margenes de fase y de ganancia,
as como el ancho de banda, fueron establecidas durante este perodo. El uso
de estas herramientas, en conjunto con el desarrollo de otras ideas como los
diagramas de bloques, fue fundamental para resolver el problema de controlar
canones antiaereos.
292 6 Diseno usando la respuesta en frecuencia

Objetivos del captulo

Entender que significa respuesta en frecuencia y conocer los conceptos fun-


damentales de este enfoque.
Conocer la relacion entre las caractersticas de respuesta en frecuencia y
las caractersticas de respuesta en el tiempo.
Usar los conceptos de respuesta en frecuencia para el analisis y diseno de
sistemas de control.
En el captulo 5 se presenta un metodo para disenar sistemas de control
que se conoce como el metodo de la respuesta en el tiempo. La caracterstica
principal de ese metodo es que trata de ubicar convenientemente los polos de
lazo cerrado de manera que la respuesta transitoria tenga las caractersticas
deseadas. Para ese metodo es fundamental saber como es la respuesta transi-
toria en el tiempo que introducen los polos de lazo cerrado: reales, complejos
conjugados, sencillos, repetidos, etc.
En el presente captulo se introduce un nuevo metodo para el diseno de
sistemas de control que se conoce como el metodo de la respuesta en frecuencia.
Fundamental para este estudio es entender que si una ecuacion diferencial
lineal se excita con una entrada que es una funcion sinusoidal del tiempo,
entonces la salida tambien sera, en estado estacionario, una funcion sinusoidal
del tiempo de la misma frecuencia que la entrada pero con una amplitud y
una fase diferentes. La base de este metodo radica en estudiar como varan la
amplitud y la fase de la senal de salida al cambiar la frecuencia de la senal
sinusoidal aplicada a la entrada. Esto es lo que se conoce como respuesta en
frecuencia. Como se muestra en este captulo, la manera en que cambian la
amplitud y la fase de la senal de salida depende de como son y en donde estan
ubicados los polos y los ceros de la funcion de transferencia correspondiente a
la ecuacion diferencial bajo estudio. La estrategia de diseno en este metodo es
modificar convenientemente las caractersticas de respuesta en frecuencia del
sistema en lazo abierto de manera que se obtengan las caractersticas deseadas
de la respuesta en el tiempo del sistema en lazo cerrado.
Puede afirmarse que cualquier problema de diseno en control clasico puede
ser resuelto usando cualquiera de los metodos: el metodo de la respuesta en
el tiempo o el metodo de la respuesta en frecuencia. Esto significa que ambos
metodos suministran las herramientas necesarias para cualquier problema de
control clasico. Sin embargo, dado que cada metodo analiza el mismo problema
desde puntos de vista diferentes, cada uno suministra informacion que puede
ser complementaria a la suministrada por el otro metodo. As que es muy
importante que se dominen ambos metodos.

6.1. Un circuito RC de corriente alterna


A continuacion se presentan algunos resultados experimentales obtenidos
con el circuito electrico de la figura 6.1(a). Se utiliza un generador de senales
6.1 Un circuito RC de corriente alterna 293

para aplicar el siguiente voltaje de entrada:

vi (t) = A sin(t) (6.1)

En el osciloscopio se observa una situacion como la que se muestra en la figura


6.1(b), es decir el voltaje de salida (en el capacitor) tiene la forma:

v0 (t) = B sin(t + )
360 t
= [grados]
T
Esto significa que ambas senales vi (t) y v0 (t) son funciones sinusoidales de la

i (t) i (t) C 0 (t)

(a)

A
B

t t
0 (t)
i (t)

(b)

Figura 6.1. Relaciones entre los voltajes de entrada y de salida en un circuito RC.

misma frecuencia. Es importante aclarar que, bajo la situacion mostrada en la


figura 6.1(b), el valor de es considerado negativo, es decir que el voltaje de
salida, v0 (t), esta atrasado respecto de la entrada, vi (t). Utilizando diferentes
valores de frecuencia, , se obtienen las mediciones mostradas en la tabla 6.1
las cuales se muestran graficadas en la figura 6.2 (lnea continua). La primera
de estas figuras muestra como vara el cociente B/A al cambiar la frecuencia
y la otra como vara la fase al cambiar la frecuencia .
294 6 Diseno usando la respuesta en frecuencia

Tabla 6.1. Datos obtenidos experimentalmente con el circuito de la figura 6.1(a).


f [Hz] = 2f [105 rad/s] A [V] B [V] [grados]
50 0.0031 1.04 1.04 0
60 0.0038 1.04 1.04 0
70 0.0044 1.04 1.04 0
80 0.0050 1.08 1.08 0
90 0.0057 1 1 0
100 0.0063 0.7 0.7 0
200 0.0126 0.7 0.68 0
300 0.0188 0.98 0.94 -11.92
400 0.0251 1.02 0.9 -13.06
500 0.0314 1.2 1.1 -18
600 0.0377 1.2 1.1 -23.85
700 0.0440 1.22 1.1 -25.71
800 0.0503 1.24 1.1 -29.03
900 0.0565 1.22 1.08 -29.45
1000 0.0628 1.04 0.88 -29.38
2000 0.1257 1.22 0.8 -52.89
3000 0.1885 1.22 0.62 -65.8
4000 0.2513 1.22 0.5 -79.28
5000 0.3142 1.2 0.4 -79.2
6000 0.3770 1.12 0.28 -81.42
7000 0.4398 1.02 0.252 -88.73
8000 0.5027 0.83 0.22 -85.71
9000 0.5655 1.08 0.212 -94
10000 0.6283 1.08 0.28 -86.4
20000 1.2566 1.2 0.112 -83.22
30000 1.8850 1.2 0.08 -86.74
40000 2.5133 1.2 0.057 -83.52
50000 3.1416 1.18 0.047 -86.4

Se dice que el comportamiento mostrado en la figura 6.2 es el de un filtro


pasa bajas. Esto significa que las senales de baja frecuencia (cercanas a = 0)
son poco atenuadas, B/A 1, mientras que las senales de alta frecuencia (
muy grande) son fuertemente atenuadas, B/A 0. Por atenuar se debe
entender que el voltaje de salida v0 (t) tiene un amplitud menor que la amplitud
del voltaje de entrada vi (t), es decir, B es menor que A.

6.1.1. Representaciones graficas comunes

Graficas de Bode

Suponga que se tiene un numero k. El valor correspondiente en decibeles


(dB) se obtiene mediante la operacion:
6.1 Un circuito RC de corriente alterna 295
B
A

p1
2

1
RC


[grados]
45

1
RC
! [rad=s]

Figura 6.2. Datos obtenidos experimentalmente con el circuito de la figura 6.1(a)


(vease la tabla 6.1).

kdB = 20 log(k)
donde log(k) representa el logaritmo base 10 de k. El logaritmo base 10 de k
se define del siguiente modo. Si:
10z = k
entonces z = log(k). A continuacion se presentan algunas propiedades impor-
tantes y algunos valores que toman los logaritmos:
log(xy) = log(x) + log(y), log(x/y) = log(x) log(y), (6.2)
log(xm ) = m log(x), log(1) = 0,
Si x 0 entonces log(x)
Las graficas de Bode se dibujan sobre papel semilogartmico: el eje horizontal
() tiene escala logartmica mientras que el eje vertical tiene escala lineal.
Utilizando los valores de la tabla 6.1 se obtienen los datos mostrados en la
tabla 6.2. En la figura 6.3 se muestran las graficas de Bode correspondientes
(lnea continua).
Notese lo siguiente:
Cuando 0. En la figura 6.3 se tiene que 20log(B/A) 0 [dB] lo
cual corresponde, en la figura 6.2, a B/A 1. Esto esta de acuerdo con
log(1) = 0. En ambas figuras 6.3 y 6.2 se tiene que 0[grados].
296 6 Diseno usando la respuesta en frecuencia

Tabla 6.2. Datos obtenidos experimentalmente con el circuito de la figura 6.1(a).


= 2f [105 rad/s] 20log(B/A) [dB] [grados]
0.0031 0 0
0.0038 0 0
0.0044 0 0
0.0050 0 0
0.0057 0 0
0.0063 0 0
0.0126 -0.2518 0
0.0188 -0.3620 -11.92
0.0251 -1.0872 -13.06
0.0314 -0.7558 -18
0.0377 -0.7558 -23.85
0.0440 -0.8993 -25.71
0.0503 -1.0406 -29.03
0.0565 -1.0587 -29.45
0.0628 -1.4510 -29.38
0.1257 -3.6654 -52.89
0.1885 -5.8794 -65.8
0.2513 -7.7478 -79.28
0.3142 -9.5424 -79.2
0.3770 -12.0412 -81.42
0.4398 -12.1440 -88.73
0.5027 -11.5331 -85.71
0.5655 -14.1418 -94
0.6283 -11.7253 -86.4
1.2566 -20.5993 -83.22
1.8850 -23.5218 -86.74
2.5133 -26.4661 -83.52
3.1416 -27.9957 -86.4

Cuando +. En la figura 6.3 se tiene que 20log(B/A) [dB]


lo cual corresponde, en la figura 6.2, a B/A 0. Esto esta de acuerdo
con log(x) si x 0. En ambas figuras 6.3 y 6.2 se tiene que
90[grados].
Cuando = 1/RC =10 000[rad/s]. En la figura 6.3 se tiene que
20log(B/A)
= 3 [dB] lo cual corresponde, en la figura 6.2, a B/A = 1/ 2. En ambas
figuras 6.3 y 6.2 se tiene que = 45[grados].
Es posible observar que en las graficas de Bode es mas facil identificar la
frecuencia a partir de la cual el circuito RC atenua las senales de salida. Esta
es una de las razones por las que se introducen las graficas de Bode.
6.1 Un circuito RC de corriente alterna 297

20log B A
[dB] 3

1
RC


[grados]

45

1
RC

! [rad=s]

Figura 6.3. Graficas de Bode para el circuito en la figura 6.1(a).

Graficas polares
En la figura 6.4 se define el numero complejo G de la siguiente manera:
B
G= = Re(G) + jIm(G)
A
B B B
|G| = , Re(G) = cos(), Im(G) = sin()
A A A

G
Im (G)
jG j


Re (G)

Figura 6.4. Numero complejo.

Usando estas definiciones, los valores mostrados en la tabla 6.1 se pueden


graficar como en la figura 6.5 (lnea continua). Esta grafica se conoce como
298 6 Diseno usando la respuesta en frecuencia

grafica polar. En esta grafica la frecuencia crece desde = 0 hasta = +


de acuerdo a la direccion indicada por la flecha. De acuerdo a la definicion de
G, el cociente B/A esta determinado por la distancia hacia el origen medida
desde el punto correspondiente y es el angulo medido respecto del eje real
positivo. Con estas observaciones es posible identificar los puntos a los cuales
= 0, = + y = 1/RC (aquel en el cual el angulo formado con el eje
real positivo es 45[grados]). La razon principal por la que se introduce la
grafica polar tiene que ver con el criterio de estabilidad que se presentara mas
adelante.

! =+1 !=0
Im(G)

45


! = R1C

Re(G)

Figura 6.5. Grafica polar para el circuito de la figura 6.1(a).

6.1.2. Modelo matematico

Aplicando la ley de voltajes de Kirchhoff al circuito de la figura 6.1(a) se


encuentra:
Z Z
1 t 1 t
vi (t) = iR + i( )d, v0 (t) = i( )d
C 0 C 0
Aplicando la transformada de Laplace (3.2):
1 1
Vi (s) = I(s)R + I(s), V0 (s) = I(s)
sC sC
6.1 Un circuito RC de corriente alterna 299

Combinando estas expresiones se tiene:


a 1
V0 (s) = Vi (s), a= (6.3)
s+a RC
Sea vi (t) la senal presentada en (6.1), entonces su transformada de Laplace
esta dada como:
A
Vi (s) = (6.4)
s2 + 2
Por tanto, expandiendo en fracciones parciales:
a A F Cs + D
V0 (s) = = + 2 (6.5)
s + a s2 + 2 s+a s + 2
Las constantes C y de D se calculan del siguiente modo. Multiplicando ambos
miembros de (6.5) por el factor s2 + 2 y evaluando en s = j:
aA
= jC + D
j + a
Multiplicando el miembro izquierdo por el factor (j + a)/(j + a) e igua-
lando partes reales e imaginarias se tiene:

a2 A aA
D= , C=
2 + a2 2 + a2
Entonces:
Cs + D aA s a2 A
2 2
= 2 2 2 2
+
s + +a s + + a s + 2
2 2 2

Usando los pares transformados:


s
L{cos(t)} = , L{sin(t)} =
s2 + 2 s2 + 2
se encuentra:

Cs + D aA
L1 = [ cos(t) + a sin(t)]
s2 + 2 2 + a2
De acuerdo a la figura 6.6 se puede escribir:

1 Cs + D aA 2 + a2
L = [sin() cos(t) + cos() sin(t)]
s2 + 2 2 + a2

a
= A sin(t + ), = atan (6.6)
2 + a2 a

Por tanto, aplicando la transformada inversa de Laplace a (6.5) se obtiene:


300 6 Diseno usando la respuesta en frecuencia
a

p
a2 !
+
!2

Figura 6.6. Triangulo definido por la fase .

a
v0 (t) = F eat + A sin(t + )
2+ a2
1
Como a = RC > 0 entonces:
a
v0 (t) B sin(t + ), B = A (6.7)
2 + a2
conforme t . Esto significa que si el voltaje de entrada vi (t) es una
funcion seno del tiempo entonces, en estado estacionario, el voltaje de salida
v0 (t) tambien es una funcion seno del tiempo con la misma frecuencia pero
con amplitudes y fases diferentes.
A continuacion se muestra que los valores de B/A y obtenidos en (6.6)
y (6.7) tambien se pueden calcular a partir de la funcion de transferencia en
(6.3) usando el cambio de variable s = j. Defina:
a
G(s) =
s+a
y considere el cambio de variable s = j, entonces:

a a a j
|G(j)| = = =
j + a j + a a j

a(a j)
= 2 = a =
B
(6.8)
+ a2 2 + a2 A

Im(G(j))
= G(j) = atan = atan (6.9)
Re(G(j)) a

En este punto es conveniente recordar que una funcion de transferencia se


a
define como el cociente de la salida sobre la entrada, es decir G(s) = s+a =
V0 (s)
Vi (s) .
As que no es extrano que |G(j)| este dado como el cociente de las
amplitudes de la salida y de la entrada. Por otro lado, si de manera intuitiva se
asume que G(j), V0 (j), Vi (j) son numeros complejos, entonces el angulo
6.1 Un circuito RC de corriente alterna 301

de V0 (j) debe obtenerse como la suma de los angulos de G(j) y de Vi (j)


porque V0 (j) = G(j)Vi (j). Esto significa que la diferencia de angulo entre
Vi (j) y V0 (j) es igual al angulo de G(j).
En las figuras 6.2, 6.3 y 6.5 se muestran las graficas correspondientes (lnea
interrumpida) obtenidas utilizando |G(j)| y definidas en (6.8) y (6.9).
La semejanza que se aprecia en estas figuras entre las lneas continuas y las
interrumpidas son una muestra de que las relaciones obtenidas analticamente
representan satisfactoriamente la situacion experimental.
De acuerdo a (6.7), (6.8), (6.9) si vi (t) esta dada como en (6.1) entonces:

Im(G(j))
v0 (t) = A|G(j)| sin(t + ), = atan (6.10)
Re(G(j))

Por otro lado, puede repetirse el procedimiento anterior para encontrar que si
vi (t) = A cos(t) entonces:

Im(G(j))
v0 (t) = A|G(j)| cos(t + ), = atan (6.11)
Re(G(j))

6.1.3. Componentes de frecuencia

De acuerdo a las Series de Fourier, cualquier senal periodica puede ser


representada como la suma de muchas senales seno y coseno de frecuencias
diferentes. Por ejemplo, sea la funcion f (t) presentada en la figura 6.7. Su
expansion en series de Fourier esta dada como [1], pag. 457:

4k 1 1
f (t) = sin(t) + sin(3t) + sin(5t) + (6.12)
3 5

El espectro de frecuencias |F ()| es una funcion de la frecuencia que indica


las frecuencias contenidas en la funcion f (t) y cual es la contribucion de cada
una de esas frecuencias a la senal total f (t). El espectro |F ()| puede ser
interpretado como la amplitud que tiene la senal seno o coseno de frecuencia
, es decir 4k 4k 1 4k 1
, 3 , 5 ,. . ., en (6.12). El espectro de frecuencias obtenido con
las series de Fourier es discreto, es decir, solo existe contribucion de frecuencias
que son multiplos enteros de una frecuencia fundamental. En el caso de (6.12)
la frecuencia fundamental es 1, mientras que 3, 5,. . . son sus multiplos enteros
a los que se hace referencia.
El uso de la transformada de Fourier permite representar cualquier funcion
no periodica como la suma de senales seno y coseno de muchas frecuencias. En
este caso, el espectro de frecuencias es continuo, es decir, |F ()| esta definido
para frecuencias que no necesitan ser multiplos enteros de ninguna frecuencia
fundamental. A las frecuencias que contribuyen al espectro |F ()| se les conoce
como componentes de frecuencia.
El razonamiento que se presenta a continuacion es intuitivo pues un analisis
exacto esta fuera del alcance de este libro. Considere el sistema:
302 6 Diseno usando la respuesta en frecuencia

f (t)

2 2 t

Figura 6.7. Funcion del tiempo periodica.

a
V0 (s) = Vi (s) (6.13)
s+a
Suponga que vi (t) es la senal escalon que se muestra en la la figura 6.8. A

i (t)

Figura 6.8. Entrada tipo escalon.

continuacion se muestra que el uso de la transformada de Fourier permite


expresar a vi (t) como la suma de senales seno y coseno de muchas frecuencias.
En analisis de Fourier es comun encontrar la transformada de Fourier a partir
de las series de Fourier al suponer que la frecuencia fundamental 0 = 0
tiende a cero y que el armonico n0 = n tiende a la frecuencia
continua . Esto significa que se puede escribir (vease, por ejemplo [2], pag.
6.1 Un circuito RC de corriente alterna 303

72):
n=+
X
vi (t) = An [cos(nt) + j sin(nt)] (6.14)
n=

donde, j = 1, el factor colocado en el extremo derecho se introduce
para asegurar la convergencia de la sumatoria, que en el lmite 0 = 0
se convierte en una integral y se convierte en una diferencial, y An es en
general un numero complejo que representa la amplitud del armonico de
frecuencia n .
De acuerdo a lo expuesto en la seccion 3.10 el sistema en (6.13) es lineal
y, por tanto, satisface el principio de superposicion, es decir si v01 (t) es la
solucion cuando vi1 (t) es la entrada y v02 (t) es la solucion cuando vi2 (t) es la
entrada entonces 1 v01 (t) + 2 v02 (t) es la solucion cuando 1 vi1 (t) + 2 vi2 (t)
es la entrada, donde 1 y 2 son constantes arbitrarias. Por tanto, se puede
usar el principio de superposicion, (6.10), (6.11), (6.14) para obtener:
n=+
X
v0 (t) = An |G(jn)| [cos(nt + n ) + j sin(nt + n )]
n=

Im(G(jn))
n = atan (6.15)
Re(G(jn))
Es decir, la contribucion de cada una de las senales seno y coseno a la funcion
del tiempo v0 (t) esta determinada por las componentes de frecuencia = n
de la senal de entrada y por la amplificacion o atenuacion que el sistema
efectua sobre cada una de esas componentes de frecuencia. Esto significa que
la salida, v0 (t), contiene basicamente las mismas componentes de frecuencia
que, vi (t), pero amplificadas o atenuadas segun lo determine el sistema, G(s).
Tambien se dice que la salida se obtiene como el filtraje de la entrada bajo el
efecto del sistema.

Componentes de frecuencias grandes

En la figura 6.9 se muestran dos senales con forma de onda seno de diferente
frecuencia. Notese que una senal de frecuencia mayor muestra variaciones mas
rapidas en el tiempo. Esto significa que si f (t) tiene componentes de frecuencia
mayores entonces f (t) contiene variaciones mas rapidas. Por ejemplo, sea la
funcion f (t) presentada en la figura 6.7. Su expansion en series de Fourier
esta dada como:

4k 1 1
f (t) = sin(t) + sin(3t) + sin(5t) +
3 5
En la figura 6.10 se muestran varias aproximaciones de esta funcion que in-
cluyen diferentes componentes de frecuencia [1], pag. 458. Notese que mien-
tras exista mayor contenido de frecuencias grandes la funcion obtenida tiene
304 6 Diseno usando la respuesta en frecuencia

sen (! 1t)
1

sen (! 2t)

!1 > !2

Figura 6.9. Comparacion entre dos funciones seno de diferente frecuencia.

variaciones mas rapidas en el tiempo y se aproxima, poco a poco, a las dis-


continuidades abruptas que la funcion f (t) tiene en puntos especficos.

t [s]

Figura 6.10. Diferentes aproximaciones de la funcion f (t) presentada en la


figura
6.7. Lnea continua
f1 (t) = 4k
sin(t).
Lnea interrumpida f2(t) =
4k

sin(t) + 3 sin(3t) . Linea-punto f3 (t) = 4k
1

sin(t) + 31 sin(3t) + 15 sin(5t) .
6.1 Un circuito RC de corriente alterna 305

Ruido

El ruido es una senal indeseable que vara rapidamente. Esto significa que
el ruido tiene componentes de frecuencia muy grandes.

Componentes de frecuencia cero

Una senal de frecuencia cero es una senal constante. Esto se puede concluir
partir de lo siguiente:

Au cos(t) = Au = constante, si = 0

Entonces, usando terminos propios de las ingenieras electrica y electronica,


una senal f (t) que contiene una componente de frecuencia cero es una senal
que tiene una componente de CD. Esto significa que si f (t) presenta varia-
ciones entonces estas se realizan alrededor de un valor constante diferente de
cero.

6.1.4. Relacion entre la respuesta en la frecuencia y en la


respuesta en el tiempo

De acuerdo a lo expuesto en la seccion previa se concluye lo siguiente:


Considere el sistema en (6.13). Si vi (t) = A es una senal constante, es decir
de frecuencia cero = 0, entonces la salida correspondiente, en estado
estacionario, es v0 (t) = A|G(j0)| = A (veanse (6.14) y (6.15)), porque
|G(j0)| = |G(j)|=0 = 1 y = 0 cuando = 0 (vease (6.9)).
Es interesante darse cuenta que esto tambien se cumple, en estado estacio-
nario, cuando a un sistema de control se le aplica una entrada tipo escalon.
En la seccion 3.8 se muestra que si vi (t) es un escalon de altura A enton-
ces el valor final (en estado estacionario) de la salida se calcula usando el
teorema del valor final, es decir:
A
lm v0 (t) = lm sV0 (s) = lm sG(s) = G(0)A
t s0 s0 s
donde es importante observar que que si s = + j 0 tambien se tiene
que 0.
En la siguiente seccion se explica que estos resultados tambien se pueden
generalizar al caso en que G(s) es una funcion de transferencia arbitraria de
orden n. Por tanto, se puede afirmar que dada una funcion de transferencia
G(s), la cantidad |G(j)|=0 representa: i) la relacion entre la entrada y la
salida cuando la entrada es constante, o bien ii) la relacion entre la entrada
y la salida, en estado estacionario, cuando la entrada es un escalon. Notese
que en una funcion de transferencia arbitraria no se cumple, en general,
que G(0) = 1.
306 6 Diseno usando la respuesta en frecuencia

Considere el sistema en (6.13). Las componentes de alta frecuencia que


contiene la entrada vi (t) son fuertemente atenuadas, es decir casi no tienen
efecto sobre la salida v0 (t), porque |G(j)| 0 conforme (vease
(6.14), (6.15) y (6.8)). De nuevo, este resultado puede extenderse al caso de
una funcion de transferencia arbitraria G(s) de orden n que cumpla que
|G(j)| 0 conforme . Esta condicion tiene dos consecuencias
importantes:
i) Suponga que vi (t) es un escalon. Tal como se menciona en la seccion pre-
via, las componentes de alta frecuencia son las que generan la discontinui-
dad que tiene esta funcion en t = 0. Como el efecto de estas componentes
es fuertemente atenuado, entonces la salida v0 (t) no presentara ninguna
discontinuidad en t = 0 (vease la figura 3.1 en el captulo 3).
ii) El efecto del ruido sobre la salida es fuertemente atenuado.
La rapidez de respuesta del sistema en (6.13) se incrementa al aumentar
el parametro a > 0. Esto se concluye del siguiente modo.
Se ha mencionado que la rapidez de una senal se incrementa al aumentar
su contenido de frecuencias mayores. Por tanto, la rapidez de respuesta del
sistema en (6.13) se puede incrementar si v0 (t) tiene una mayor contribu-
cion de componentes de frecuencias mayores. En la figura 6.11 se muestra
que el valor de |G(j)| puede incrementarse para frecuencias mayores si
se usa un valor mas grande de a. Esto se comprueba con lo expuesto en
la seccion 3.1 del captulo 3 donde se explica que la rapidez de un sistema
con funcion de transferencia G(s) = a/(s + a) se incrementa al aumentar
el valor de a.

jG (j!)j

p
1= 2

0 a1 a2
!

a
Figura 6.11. Un valor mayor de a en el sistema s+a permite un mayor efecto de las
frecuencias intermedias y, por tanto, una mayor rapidez de respuesta en el tiempo.

Es importante subrayar que se busca incrementar la contribucion de fre-


cuencias mayores pero no aquellas que son demasiado elevadas ( )
las cuales acentuaran el efecto del ruido. Con el fin de resaltar esta ca-
6.2 Sistemas arbitrarios de orden n 307

racterstica, se usa el termino frecuencias intermedias para referirse a


aquellas frecuencias que se utilizan para mejorar la rapidez de respuesta.
Esta idea puede extenderse al caso de una funcion de transferencia arbi-
traria G(s) de orden n, indicando que su rapidez de respuesta es mayor
conforme sus polos se colocan mas lejos del origen.

6.2. Sistemas arbitrarios de orden n


Los conceptos presentados en la seccion 6.1 se han realizado considerando
la funcion de transferencia en (6.13). Esto se ha hecho con el proposito de
explicar de manera sencilla los conceptos introducidos ah. En la presente
seccion se muestra que todas las ideas expuestas en la seccion 6.1 tambien
pueden generalizarse al caso de sistemas lineales arbitrarios de orden n.
Considere la funcion de transferencia arbitraria de orden n:
Y (s) E(s)
= G(s) = (6.16)
U (s) N (s)
N (s) = sn + an1 sn1 + + a1 s + a0
E(s) = b0 + b1 s + + bm sm

donde n m y u(t) = A sin(t), por lo que U (s) = A s2 + 2 . Sustituyendo

U (s) en (6.16) y usando expansion en fracciones parciales:


Cs + D
Y (s) = G(s)A = Yn (s) + 2 (6.17)
s2 + 2 s + 2
donde Yn (s) = L{yn (t)} es la respuesta natural la cual, de acuerdo al captulo
3, satisface lmt yn (t) = 0 si G(s) es estable. Con el fin de facilitar la
exposicion se supone que G(s) no tiene polos en s = j. Multiplicando
ambos miembros de (6.17) por el factor s2 + 2 y evaluando en s = j se
encuentra:

AG(j) = jC + D

Igualando partes reales e imaginarias se obtiene:

C = AIm(G(j)), D = ARe(G(j))

donde G(j) = Re(G(j)) + jIm(G(j)). Por tanto:


Cs + D s
2 2
= AIm(G(j)) 2 2
+ ARe(G(j)) 2
s + s + s + 2
Usando los pares transformados:
s
L{cos(t)} = , L{sin(t)} =
s2 + 2 s2 + 2
308 6 Diseno usando la respuesta en frecuencia

se obtiene:

Cs + D
L1 = A[Im(G(j)) cos(t) + Re(G(j)) sin(t)]
s2 + 2
Usando la figura 6.12 se encuentra que:

Cs + D
L1 = A|G(j)| [sin() cos(t) + cos() sin(t)] (6.18)
s2 + 2
= B sin(t + ), B = A|G(j)|,

Im(G(j))
= atan ,
Re(G(j))
q
|G(j)| = Re2 (G(j)) + Im2 (G(j))

Entonces, de acuerdo a (6.17) se encuentra que:

) )
(j!
2 (G
Im
)+
j! ) Im (G (j!) )
(G( 2
p Re

Re (G (j!) )

Figura 6.12. Triangulo definido por la fase .

y(t) A|G(j)| sin(t + )

conforme t si G(s) es estable. Por tanto, si la entrada u(t) de un sistema


lineal G(s) de orden n es una funcion seno, entonces la salida y(t) tambien
es, en estado estacionario, una funcion seno de la misma frecuencia pero con
una amplitud y una fase que son, en general, diferentes a la amplitud y a la
fase de la entrada. La relacion entre la amplitud de la entrada y la amplitud
de la salida a la frecuencia se puede calcular como:
B
= |G(j)|
A
y se conoce como magnitud de la funcion de transferencia mientras que la
diferencia de fase entre la entrada y la salida esta dada por en (6.18) y se
conoce como fase de la funcion de transferencia. Este resultado es identico al
6.3 Graficas polares y de Bode 309

encontrado en la seccion 6.1. Por tanto, todas las afirmaciones realizadas para
G(s) en esa seccion son validas cuando G(s) es una funcion de transferencia
arbitraria de orden n. Entonces, se esta en posicion de afirmar lo siguiente:
Por respuesta en frecuencia debemos entender, la descripcion de:
Como vara el cociente de la amplitud de la senal de salida entre la am-
plitud de la senal de entrada cuando se vara la frecuencia de la senal de
entrada.
Como vara el defasaje entre la senal de entrada y la senal de salida cuando
se vara la frecuencia de la senal de entrada
Estas dos cractersticas son muy importantes, pues permiten determinar de
manera exacta la manera en que responde un sistema de control: respues-
ta transitoria (rapidez y oscilaciones) y respuesta en estado estacionario.
Ademas, tal como se muestra en las secciones subsecuentes, tambien se pue-
den establecer metodos que permiten determinar la estabilidad de un sistema
en lazo cerrado. En este sentido es importante mencionar que todas las ideas
expuestas en las secciones 6.1 y 6.2 tambien pueden ser extendidas a funciones
de transferencia inestables: solo hay que recordar que, aunque en tal caso la
respuesta natural no desaparece al crecer el tiempo, la respuesta forzada es
una sinusoide si la entrada tambien lo es.

6.3. Graficas polares y de Bode

Un concepto importante en graficas de Bode es el denominado decada


cuya abreviacion es dec. En graficas de Bode es de mucho interes analizar
la frecuencia por decadas. Una decada representa un incremento de diez
veces en el valor de la frecuencia. Por ejemplo si 1 = 2.5 y 2 = 25 entonces
se dice que hay una decada entre 1 y 2 .
La funcion de transferencia arbitraria de orden n definida en (6.16) se
puede escribir como:
Qj=m
bm j=1 (s zj )
G(s) = Qi=n (6.19)
i=1 (s pi )

donde zj , j = 1, . . . , m, son los ceros de G(s) y pi , i = 1, . . . , n, son los polos de


G(s). Dado que los polos y los ceros pueden ser reales o complejos conjugados
entonces las graficas polares y de Bode de G(s) siempre pueden construirse
a partir del conocimiento de las graficas polares y de Bode de los siguientes
factores fundamentales de primero y segundo orden:
1 s+a a
s, , , , (6.20)
s a s+a
s2 + 2n s + n2 n2
,
n2 s + 2n s + n2
2
310 6 Diseno usando la respuesta en frecuencia

por esta razon, en las figuras 6.13, 6.14, 6.15 y 6.16 se presentan las graficas
de Bode y polares de estos factores.
Recuerdese que las graficas de Bode de magnitud son curvas que represen-
tan la cantidad:

20 log (|G(j)|)

como funcion de la frecuencia . Las graficas de Bode de fase son curvas que
representan la cantidad:

Im(G(j))
= atan
Re(G(j))

como funcion de la frecuencia . Por otro lado, cada punto de las graficas
polares representa la cantidad:

G(j) = Re(G(j)) + jIm(G(j)) = |G(j)|

Las flechas que aparecen en las graficas polares siempre apuntan en el sentido
en el que la frecuencia crece, es decir, desde = pasando por = 0
hasta = +. El lector puede recurrir a [3], [4] si desea conocer el metodo
detallado que se utiliza normalmente para obtener las graficas mostradas en
las figuras 6.13, 6.14, 6.15 y 6.16.
Las lneas gruesas en las graficas de Bode de las figuras 6.13 y 6.14 se
conocen como asntotas, mientras que las lneas finas representan el valor
exacto de las funciones representadas. Las asntotas solo son aproximaciones
que, sin embargo, son de mucha utilidad para reconocer la forma fundamen-
tal de las graficas de Bode correspondientes. Notese que en algunas de las
graficas de Bode de magnitud las asntotas forman una esquina. La frecuen-
cia a la cual ocurre dicha esquina se conoce como frecuencia de esquina y
esta directamente relacionada con el cero o el polo del factor de primero o
segundo orden que se representa. Recuerdese que, de acuerdo a la seccion 3.3,
n es la distancia medida desde la raz correspondiente (polo o cero) hasta
el origen y que p las races de un factor de segundo orden estan dadas como
s = n jn 1 2 .
De acuerdo a lo que describen las asntotas, para frecuencias menores a la
frecuencia de esquina la magnitud de todos los factores en (6.20) (a excepcion
de s y 1/s) es de 0[dB], pero para frecuencias mayores que la frecuencia de
esquina la magnitud crece (ceros) o disminuye (polos) con una rapidez de
20[dB/dec] para los factores de primer orden y de 40[dB/dec] para los
factores de segundo orden. Notese que en el caso de los factores de segundo
orden, el comportamiento de la curva exacta cerca de la frecuencia de esquina
depende fuertemente del factor de amortiguamiento . De hecho, si < 0.7071,
alrededor de la frecuencia de esquina existe un maximo de magnitud cuyo valor
crece hacia el infinito conforme tiende a cero. Este maximo de magnitud se
conoce como pico de resonancia y su valor se representa por Mr .
6.3 Graficas polares y de Bode 311
jG(j!)j
[dB]

pendiente :
20 dB=dec

G(j!)
[grados]

0:1 1 10
! [rad=s]
1
(a) G(s) = s
jG(j!)j
[dB]
pendiente :
+ 20 dB=dec

G(j!)
[grados]

0:1 1 10
! [rad=s]

(b) G(s) = s

jG(j!)j
[dB]
pendiente :
20 dB=dec

G(j!)
[grados]

45

0:01a 0:1a a 10a 100a


! [rad=s]
a
(c) G(s) = s+a

Figura 6.13. Graficas de Bode de los factores de primero y segundo orden en (6.20).
312 6 Diseno usando la respuesta en frecuencia
jG(j!)j
[dB]
pendiente :
+ 20 dB=dec

G(j!)
[grados]

+ 45

0:01a 0:1a a 10a 100a


! [rad=s]
s+a
(a) G(s) = a
jG(j!)j = 0:1
0:3
[dB]
0:7
0:9
pendiente :
2 40 dB=dec

G(j!) = 0:1
[grados] 0:5 0:3

90
0:9 2
0:7

0:1! n !n 10! n
! [rad=s]
2
n
(b) G(s) = s2 +2n s+n
2

jG(j!)j
[dB]
pendiente :
2 + 40dB=dec
0:9
0:7
0:3
= 0:1

G(j!)
[grados] 0:7 0:9
2
+ 90

0:5 0:3
= 0:1

0:1! n !n 10! n
! [rad=s]
s2 +2n s+n
2
(c) G(s) = 2
n

Figura 6.14. Graficas de Bode de los factores de primero y segundo orden en (6.20)
(cont.).
6.3 Graficas polares y de Bode 313
Im (G(j!))
! ! 0

! ! 1
Re (G(j!))
! ! +1

! ! 0+

1
(a) G(s) = s

Im (G(j!))
! ! +1

!=0 Re (G(j!))

! ! 1

(b) G(s) = s
Im (G(j!))

! ! 1
!=0 Re (G(j!))
! ! +1

a
(c) G(s) = s+a

Figura 6.15. Graficas polares de los factores de primero y segundo orden en (6.20).
314 6 Diseno usando la respuesta en frecuencia
Im (G(j!))
! ! +1

! = 0 Re (G(j!))

! ! 1

s+a
(a) G(s) = a
Im (G(j!))

= 0:1

0:3
0:5
0:7
2 1
0:9 ! !
!=0 Re (G(j!))
! ! +1

2
n
(b) G(s) = s2 +2n s+n
2

Figura 6.16. Graficas polares de los factores de primero y segundo orden en (6.20)
(cont.).

En cuanto a las graficas de Bode de fase se puede decir lo siguiente. Cada


factor de primer orden introduce una fase que va de cero hasta +90 grados
(ceros) o hasta 90 grados (polos). Cada factor de segundo orden introduce
una fase que va de cero hasta +180 grados (ceros) o hasta 180 grados (polos).
En todos los casos, cuando la frecuencia es igual a la frecuencia de esquina
la fase es igual a la mitad del rango correspondiente. De nuevo, en el caso de
factores de segundo orden y alrededor de la frecuencia de esquina, la curva
de fase depende fuertemente del factor de amortiguamiento : la fase cambia
mas rapidamente entre 0 y 180 grados conforme tiende a cero.
Es importante observar que si el factor en (6.20) contiene ceros, entonces
las graficas polares y de Bode correspondientes muestran que dicho factor se
comporta como un filtro pasa altas y que esto va acompanado de un adelanto
de fase, es decir el factor contribuye con fase positiva. Esta observacion es im-
6.3 Graficas polares y de Bode 315

portante porque significa que los ceros de una funcion de transferencia tienden
a incrementar el efecto que el ruido tiene sobre un sistema de control. Esto
implica que el uso de una ganancia derivativa excesivamente grande en un con-
trolador PD o PID puede resultar en un sistema de control cuyo desempeno se
ve deteriorado. Para entender esto observese que un controlador PD introduce
un cero de lazo abierto mientras que un controlador PID introduce dos ceros
de lazo abierto. Por otro lado, tal como se menciona en la seccion 5.1.1, un
cero de lazo abierto tiende a mejorar la estabilidad de un sistema de control
en lazo cerrado. As que al disenar un sistema de control se debe de tratar
de establecer un compromiso entre estabilidad y deterioro del desempeno por
efectos del ruido. En la seccion 6.6 se explica que el efecto estabilizante de un
cero de lazo abierto se debe al adelanto de fase que introduce en la respuesta
en frecuencia de la funcion de transferencia de lazo abierto.
Por otro lado, si el factor en (6.20) contiene polos, entonces las graficas
polares y de Bode correspondientes muestran que dicho factor se comporta
como un filtro pasa bajas y que esto va a companado de un atraso de fase, es
decir el factor contribuye con fase negativa. Esto significa que los polos de una
funcion de transferencia reducen el efecto del ruido. Por otro lado, tal como
se menciona en la seccion 5.1.1, un polo de lazo abierto tiende a deteriorar
la estabilidad de un sistema de control en lazo cerrado. En la seccion 6.6 se
explica que este efecto se debe al atraso de fase que un polo introduce en la
respuesta en frecuencia de la funcion de transferencia de lazo abierto.
Las graficas de respuesta en frecuencia de la funcion de transferencia arbi-
traria de orden n definida en (6.19) se obtiene mediante la combinacion de los
factores en (6.20). En el caso de las graficas de Bode este proceso de combina-
cion de factores de primero y segundo orden es muy sencillo, como se explica
a continuacion. Notese que la funcion de transferencia arbitraria de orden n,
G(s), dada en (6.19) se puede escribir como:
k=r
Y
G(s) = Gk (s)
k=1

para alguna constante real y algun numero entero positivo r, donde Gk (s),
para k = 1, . . . , r, tiene la forma de uno de los factores presentados en (6.20).
Entonces:
k=r
Y k=r
Y

|G(j)| = Gk (j) = || |Gk (j)|

k=1 k=1

De acuerdo a esto, a la definicion de decibeles |G(j)|dB = 20 log(|G(j)|) y


a la propiedad log(xy) = log(x) + log(y) presentada en (6.2) se puede escribir:
k=r
X
|G(j)|dB = 20 log(||) + 20 log(|Gk (j)|)
k=1
316 6 Diseno usando la respuesta en frecuencia

Esto significa que la grafica de Bode de magnitud (y la grafica de Bode de


fase) de una funcion de transferencia arbitraria de orden n, G(s), siempre se
puede obtener como la suma de las graficas de Bode de magnitud (y de las
graficas de Bode de fase) de todos los factores de primero y de segundo orden
de G(s)1 . Notese, sin embargo, que esto no es cierto para las graficas polares
donde se debera realizar el producto de las magnitudes y la suma de las fases
de todos los factores de primero y segundo orden de G(s). Para simplificar este
procedimiento se recomienda obtener primero las graficas de Bode y a partir
de ellas obtener la informacion requerida para dibujar las graficas polares
correspondientes. En la siguiente seccion se presentan algunos ejemplos de
aplicacion de estas ideas.
Ejemplo 6.1 (Resonancia). Sea el sistema masa-resorte-amortiguador mos-
trado en la figura 6.17. La funcion de transferencia es en este caso igual a la
del ejemplo 3.6 del captulo 3, es decir:

kn2
X(s) = G(s)F (s), G(s) = 2
s + 2n s + n2
r
K b 1
n = , = , k=
m 2 mK K
donde x = 0 se define como la posicion en la cual el sistema alcanza el reposo
cuando f (t) = 0 y bajo el efecto del peso de la masa y el resorte. La disposicion
de la figura 6.17 es equivalente a la de un automovil que se encuentra en reposo
sobre el suelo: m representa la masa del automovil, K representa la rigidez
del sistema de suspension y b representa el efecto de los amortiguadores. La
experiencia cotidiana nos ha ensenado que, aunque es muy pesado, un auto
pequeno puede ser volteado por unas pocas personas si las personas lo someten
a una fuerza como la siguiente. Se empuja el auto hacia arriba y se le suelta
para que despues de rebotar abajo se le vuelve a aplicar la misma fuerza hacia
arriba cuando el auto se encuentra moviendose hacia arriba. Aunque la fuerza
aplicada cada vez es pequena como para voltear al auto, sin embargo, despues
de aplicar esta misma accion varias veces se consigue voltear el auto. Este es
un ejemplo claro de lo que puede conseguirse cuando se somete un automovil
a resonancia y a continuacion se analiza dicha situacion.
La fuerza que es aplicada por las personas tiene una forma periodica que
tiene una componente fundamental con forma de onda coseno. Cuando es-
ta fuerza es positiva se empuja al auto hacia arriba, cuando es negativa se
deja caer el auto. El hecho de aplicar fuerza solo cuando el auto se mueve
hacia arriba implica que esta componente cosenoidal tiene una frecuencia
que es igual a la frecuencia natural de oscilacion del auto n . Si se supone
que no hay amortiguadores entonces b = 0, lo cual implica que = 0. De
acuerdo a la figura 6.14(b), bajo esta situacion la salida x(t) (posicion del
1
Recuerdese que dados tres numeros complejos z, x, y tales que z = xy, la fase de
z es igual a la suma de las fases de x y de y
6.3 Graficas polares y de Bode 317

x
m

K b

Figura 6.17. Suspension de un automovil.

auto) esta atrasada 90 respecto de la fuerza aplicada. Esto significa que si


f (t) = A cos(t) entonces x(t) = B sin(t), para alguna constante B positiva,
si = n . Entonces, de acuerdo a la figura 6.18, se aplica una fuerza maxima
(f tiene una cresta) justo cuando el auto se esta moviendo hacia arriba (x
esta pasando de un valle a una cresta), lo cual esta en completo acuerdo con
la aplicacion intuitiva de fuerza por parte de las personas. Ademas si = n
y = 0 la amplitud B de la osiclacion descrita por el auto crecera sin lmite
aun cuando la amplitud de la fuerza de entrada A sea pequena (B = |G(n )|A
y |G(n )| ) por lo que finalmente el auto podra ser volteado.
Ahora se presentara una explicacion desde el punto de vista de la fsica
que ayude a entender porque sucede esto. La energa del sistema esta dada
como la suma de la energa cinetica mas la energa potencial:
E = E c + Ep ,
1 1
Ec = mx2 , Ep = Kx2
2 2
El efecto de la gravedad no se toma en consideracion porque se ha supuesto
que x = 0 es la posicion en la que el cuerpo alcanza el reposo cuando f = 0
bajo el efecto de la gravedad y del resorte. Conforme el tiempo transcurre la
variacion de esta energa esta dada como:
E = Ec + Ep = mxx + Kxx
Utilizando el modelo para calcular x, es decir:
b K 1
x = x x + f
m m m
se obtiene que:
318 6 Diseno usando la respuesta en frecuencia

f(t) = Acos(! n t)

x(t) = Bsin(! n t)

tiempo

Figura 6.18. Fuerza aplicada y posicion resultante cuando se somete a resonancia


el cuerpo de la figura 6.17.

E = bx2 + xf

Considerense dos casos:


1. = 0, f = A cos(n t). En este caso b = 0 y de acuerdo a la figura
6.14(b), la salida x(t) esta atrasada 90 respecto de la fuerza aplicada, es
decir x(t) = B0 sin(n t) y x = n B0 cos(n t) para alguna B0 positiva y,
entonces:

E = xf = n AB0 cos2 (n t)

Por lo que la energa de la masa crece sin lmite conforme el tiempo


aumenta porque, dado que cos2 (n t) 0 para todo t:
Z t
E = n A B0 cos2 (n r)dr , cuando t
0

Como E = Ec + Ep con x(t) y x sinusoidales entonces la amplitud de


estas oscilaciones crece sin lmite tambien, tal como lo describe la figura
6.14(b).
2. > 0, f = A cos(n t). En este caso b > 0 y de acuerdo a la figura 6.14(b),
la salida x(t) converge (despues de que la respuesta natural se hace des-
preciable) a una funcion que esta atrasada un angulo igual a 90 respecto
de la fuerza aplicada, es decir x(t) = B0 sin(n t) y x = n B0 cos(n t)
para alguna B0 positiva y, entonces:
6.4 Graficas de respuesta en frecuencia. Ejemplos 319

E = bx2 + xf = bn2 B02 cos2 (n t) + n AB0 cos2 (n t)

Por tanto, la energa de la masa esta dada como:


Z t
E= [bn2 B02 cos2 (n r) + n AB0 cos2 (n r)]dr
0
Z t
= [bn2 B02 + n AB0 ] cos2 (n r)dr (6.21)
0

Mientras la amplitud B0 de la posicion sea pequena se cumplira que


bn2 B02 + n AB0 > 0 y, por tanto, la energa E y la amplitud B0 aumen-
tan. Entonces B0 aumentara hasta que bn2 B02 + n AB0 < 0 porque A
es constante. En ese momento, la energa deja de aumentar y se obtiene
un estado estacionario cuando bn2 B 2 = n AB, es decir, la amplitud de
la posicion B permanece constante en un valor finito dado como:
A A A kA
B= = q = = (6.22)
bn 2 mK K 2K 2
m

Notese que la amplitud de la posicion B crece sin lmite conforme tiende


a cero, lo cual esta en completo acuerdo con la figura 6.14(b) y al mismo
tiempo explica porque el pico de resonancia disminuye conforme aumenta
. En este sentido, observese que el termino bx2 0 si b > 0 (es decir,
si > 0). Esto representa la energa que se disipa en forma de calor por
motivos de rozamiento (friccion). As que la friccion es la que evita que
la energa y, por tanto, la amplitud de las oscilaciones crezcan sin lmite.
Se puede afirmar que mientras mas rozamiento haya un mayor porcentaje
de la energa suministrada a la masa mediante la fuerza f se convierte
en calor y es menos la energa que se almacena en la masa y por ello la
menor amplitud de las oscilaciones.
k
Finalmente notese que |G(j)|=n = 2 , lo cual esta en completo acuer-
do con (6.22). Tambien es importante recordar que el pico de resonancia
ocurre a una frecuencia ligeramente diferente a n cuando > 0. Sin
embargo, la magnitud de la funcion de transferencia en = n tambien
crece cuando se aproxima a cero.

6.4. Graficas de respuesta en frecuencia. Ejemplos

6.4.1. Ejemplo 1

Considere la siguiente funcion de transferencia:

s + T1
Gd (s) = 1 , 0 < < 1, T >0 (6.23)
s + T
320 6 Diseno usando la respuesta en frecuencia

De acuerdo a las propiedades en (6.2) la grafica de Bode de magnitud (en


dB) de Gd (s) en (6.23) se obtiene como la suma de las graficas de Bode de
magnitud de dos factores de primer orden:
1 1 1
T s+ T T
Gd (s) = 1 1 1 (6.24)
T T s+ T

1
El polo tiene una frecuencia de esquina en = T la cual es mayor que la
1
frecuencia de esquina del cero = T porque 0 < < 1. Este hecho determina
que Gd (s) introduzca un adelanto de fase y que tenga las caractersticas de un
filtro pasa altas: las frecuencias bajas son atenuadas pero las frecuencias altas
no. El adelanto de fase maximo producido y la atenuacion a bajas frecuencias
dependen solamente de la constante , es decir de la separacion existente entre
las frecuencias de esquina del polo y del cero. Estas observaciones pueden
apreciarse en la figura 6.19 donde se muestran las graficas de Bode de Gd (s)
y de los factores que la componen.

dB ii)
iv) !
0 1
1
T T iii)
i)

fase
[grados]

+ 90
ii)
iv)
0 1 1 !
T T
iii)
90

1
Figura 6.19. Graficas de Bode para el ejemplo 1 (vease (6.24)): i) 0 < T
1 < 1, ii)
T
1 1
s+ T T
1 , iii) 1
s+ T
, iv) Gd (s).
T

La funcion de transferencia en (6.23) es muy util para disenar un tipo es-


pecial de controladores que reciben el nombre de compensadores de adelanto.
6.4 Graficas de respuesta en frecuencia. Ejemplos 321

Esta aplicacion, sin embargo, es facilitada si se utilizan algunas manipulacio-


nes algebraicas:
Ts + 1
Gd (T s) =
T s + 1

Al hacer el cambio de variable s = j se obtiene:


jT + 1
Gd (jT ) =
jT + 1

Las graficas de Bode se pueden obtener facilmente al descomponer esta ex-


presion en los factores de primer orden que la componen:
jT + 1 1/
Gd (jT ) =
1 jT + 1

considerando que el producto T es la variable que se usa como variable


independiente, es decir en el eje horizontal de la figura 6.20. Aqu se muestran
las graficas de Bode de Gd (s) para diferentes valores de 0 < < 1.
Por otro lado, la grafica polar de Gd (T s) se puede obtener facilmente uti-
lizando la informacion proporcionada por las graficas de Bode en la figura
6.19. Para esto se debe recordar que la grafica de Bode de magnitud esta en
dB pero la grafica polar no. Se deben observar la magnitud y la fase para
las frecuencias cero e infinito para dibujar en la grafica polar trazos que re-
presenten los comportamientos correspondientes. Luego se dibujan trazos que
representen, aproximadamente, los comportamientos a las frecuencias inter-
medias y que satisfagan los trazos correspondientes a las frecuencias cero e
infinito. Finalmente, las graficas polares para frecuencias negativas, es decir
desde = hasta = 0 son las imagenes al espejo de las graficas para
frecuencias positivas. Compare la grafica polar mostrada en la figura 6.21 y
las graficas de Bode en la figura 6.19.

6.4.2. Ejemplo 2

Considere la funcion de transferencia:


Ax k
G(s)H(s) = (6.25)
s + a s3
donde las constantes Ax , , k, a, son todas positivas. Descomponiendo esta
funcion de transferencia en los factores fundamentales que la forman se puede
escribir:
Ax k a 1
G(s)H(s) =
a s + a s3
De acuerdo a las propiedades en (6.2), la grafica de Bode de magnitud del
factor s13 es una linea recta de pendiente igual a 60[dB/dec]. En la figura
322 6 Diseno usando la respuesta en frecuencia

0:9
0:7

0:4

0:2

= 0:14

= 0:14
0:2

0:4

0:7
0:9
!T
0:01 0:1 1 10 100 1000

Figura 6.20. Graficas de Bode para Gd (s) en (6.23).

Im (G d (j! ))

1 ! ! +1

!=0 ! ! 1
0 Re (G d (j! ))

Figura 6.21. Grafica polar de Gd (s) en (6.23).

6.22 se presentan las graficas de Bode de G(s)H(s), as como de los factores


que la componen. Tal como se explica en el ejemplo previo, la grafica polar
de la figura 6.23 se puede obtener facilmente a partir de las graficas de Bode
la figura 6.22.

6.4.3. Ejemplo 3

Siguiendo procedimientos como los descritos en los dos ejemplos previos


se pueden obtener las graficas polares y de Bode de las siguientes funciones
de transferencia:
6.4 Graficas de respuesta en frecuencia. Ejemplos 323

dB ii)
i)
a !
0
1 iii)
iv)

fase
[grados] a !
0
iii)
90
180
270 ii)
360 iv)

Ax k 1
Figura 6.22. Graficas de Bode de G(s)H(s) definida en (6.25): i) a
, ii) s3
,
a
iii) s+a , iv) G(s)H(s).

Im (G (j! ) H (j! ) )
! = 0+

!! +1
!! 1 Re (G (j! ) H (j! ) )

! = 0

Figura 6.23. Grafica polar de G(s)H(s) en (6.25).

s+b k
G(s)H(s) = Ax (6.26)
s + c s(s + a) s2
Ax s + b kA
G(s)H(s) = (6.27)
A s + c s2 + (a + kv kA )s + kA s2
324 6 Diseno usando la respuesta en frecuencia

donde Ax , A , , k, a, , b, c, , kv son constantes positivas. Las graficas


correspondientes se muestran en las figuras 6.24, 6.25, 6.26 y 6.27.

dB
ii)

i)
b c 1 a
0 !
v) iii)
iv)
vi)

fase
[grados]
+ 90
v) c
0 b a !
iv) iii)
90
180
270 ii)
360 vi)

Ax bk 1 a
Figura 6.24. Graficas de Bode de G(s)H(s) en (6.26): i) ac
, ii) s3
, iii) s+a
,
c
iv) s+c , v) s+b
b
, vi) G(s)H(s).

Im (G (j! ) H (j! ) )
! = 0+

!! +1
!! 1 Re (G (j! ) H (j! ) )

! = 0

Figura 6.25. Grafica polar de G(s)H(s) en (6.26).


6.5 Criterio de estabilidad de Nyquist 325

dB

ii)
p i)
b 1 kA
0 !
v) c iv) iii)

vi)

fase
[grados]
+ 90 v) p
c kA !
0
b iv) iii)
90
180 ii)
270
360 vi)

Ax b 1
Figura 6.26. Graficas de Bode de G(s)H(s) en (6.27): i) A c
, ii) s2
, iii)
kA c s+b
s2 +(a+kv kA )s+kA
, iv) s+c
, v) b
, vi) G(s)H(s).

Im (G (j! ) H (j! ) )

! = 0 !! +1
! ! 1 Re (G (j! ) H (j! ) )
! = 0+

Figura 6.27. Grafica polar de G(s)H(s) en (6.27).

6.5. Criterio de estabilidad de Nyquist


En la literatura existente sobre control clasico es comun utilizar el criterio
de Routh como el metodo que sirve para determinar si un sistema tiene alguno
326 6 Diseno usando la respuesta en frecuencia

de sus polos en el semiplano derecho. De no ser as entonces todos los polos


deben estar en el semiplano izquierdo y entonces se asegura su estabilidad. El
criterio de Routh debe aplicarse al polinomio caracterstico del sistema en lazo
cerrado y se introduce como el criterio de estabilidad para sistemas de control
cuando se estudian desde el punto de vista de su respuesta en el tiempo. El
lector puede consultar el captulo 4 de la presente obra, o las referencias [3],
[4], para mayor informacion a cerca del uso del criterio de Routh.
Ahora se introduce un nuevo criterio de estabilidad para sistemas de con-
trol en lazo cerrado que esta fundamentado, sin embargo, en la respuesta en
frecuencia del mismo sistema pero en lazo abierto. Esta curiosa caracterstica
debe ser entendida correctamente pues es frecuente confundirse por completo
debido a la siguiente pregunta: Como es posible determinar la estabilidad del
sistema en lazo cerrado estudiando la respuesta en frecuencia del sistema
en lazo abierto? En esta seccion se presenta la respuesta a tal pregunta y el
criterio que resuelve este problema se conoce como el Criterio de Nyquist.

6.5.1. Recorridos cerrados alrededor de polos y ceros

Considere la siguiente funcion de transferencia:

G(s) = s a

donde a es cualquier numero constante, real o complejo. Notese que este siste-
ma solo posee un cero en s = a. Considere una trayectoria cerrada trazada
sobre el plano s encerrando al cero en s = a y que es recorrida en sentido
horario (vease la figura 6.28). Cuando G(s) se evalua sobre significa que
el argumento s de G(s) toma sucesivamente todos los valores de s que se
encuentran sobre . Evaluese G(s) sobre :

G(s) = l, l = |s a|, = (s a)

Notese que s a puede ser representado como un vector que inicia en a


y termina en s. Es facil observar que cada vez que el recorrido sobre se
completa una vez el angulo tiene un incremento negativo (sentido horario)
de 2 radianes. Por otro lado, como no pasa sobre s = a entonces l > 0
en todo el recorrido. Esto significa que cada que el recorrido horario es
completado una vez el vector l describe una vuelta horaria alrededor del
origen. Como G(s) = l decimos que la vuelta horaria ha sido completada
alrededor del origen del plano G(s), es decir, alrededor de G(s) = 0 (vease la
figura 6.29).
A partir de esto no es difcil ver que si G(s) solo tiene m ceros y si
encierra por completo a todos esos ceros, entonces cada vez que se completa
un recorrido horario sobre se completan m vueltas horarias alrededor del
origen del plano G(s).
Considere ahora la siguiente funcion de transferencia:
6.5 Criterio de estabilidad de Nyquist 327

Im (s)

Re (s)

Figura 6.28. Recorrido cerrado alrededor de un cero.

Im (G (s))

G (s )

Re (G (s))
2

Figura 6.29. Recorrido horario alrededor del origen del plano G(s).
328 6 Diseno usando la respuesta en frecuencia

1
G(s) =
sa
donde a es cualquier numero constante, real o complejo. Notese que este siste-
ma solo posee un polo en s = a. Considere una trayectoria cerrada trazada
sobre el plano s encerrando al polo en s = a y que es recorrida en sentido
horario (vease la figura 6.30). Evaluese G(s) sobre :
1 1
G(s) = = , l = |s a|, = (s a)
l l
Notese, de nuevo, que s a puede ser representado como un vector que inicia

Im (s)

Re (s)

Figura 6.30. Recorrido cerrado alrededor de un polo.

en a y termina en s. Es facil observar que cada vez que el recorrido sobre


se completa una vez el angulo tiene un incremento positivo (sentido
antihorario) de +2 radianes. Por otro lado, como no pasa sobre s = a
entonces 1/l > 0 (y es finito) en todo el recorrido. Esto significa que cada vez
que el recorrido horario es completado una vez el vector 1l describe
una vuelta antihoraria alrededor del origen. Como G(s) = 1l decimos
que la vuelta antihoraria ha sido completada alrededor del origen del plano
G(s), es decir, alrededor de G(s) = 0 (vease la figura 6.31).
A partir de esto no es difcil ver que si G(s) solo tiene n polos y si
encierra por completo a todos esos polos, entonces cada vez que se completa
6.5 Criterio de estabilidad de Nyquist 329

Im (G (s))

+ 2

Re (G (s))

1=l

G (s )

Figura 6.31. Recorrido antihorario alrededor del origen del plano G(s).

un recorrido horario sobre se completan n vueltas antihorarias alrededor


del origen del plano G(s).

6.5.2. Trayectoria de Nyquist

R(s) + C(s)
G(s)

H(s)

Figura 6.32. Sistema en lazo cerrado.

Considere la funcion de transferencia del sistema en lazo cerrado de la


figura 6.32:

C(s) G(s)
=
R(s) 1 + G(s)H(s)
330 6 Diseno usando la respuesta en frecuencia

Si se consigue probar que esta funcion de transferencia no tiene polos en el


semiplano derecho entonces la estabilidad del sistema en lazo cerrado esta ase-
gurada. La idea es investigar la existencia de tales polos usando una trayectoria
cerrada como en la seccion previa. Suponga que se usa una trayectoria cerra-
da como la mostrada en figura 6.33, la cual es recorrida en sentido horario.
Notese que esta trayectoria encierra por completo a cualquier polo o cero que
G(s)
la funcion 1+G(s)H(s) tenga en el semiplano derecho. Esta trayectoria cerrada
se conoce como Trayectoria de Nyquist. Suponga que la funcion de transfe-
G(s)
rencia 1+G(s)H(s) tiene p polos y z ceros en el semiplano derecho. De acuerdo
a la seccion anterior, si se recorre la trayectoria de Nyquist una vez el nume-
G(s)
ro de vueltas horarias alrededor del origen del plano 1+G(s)H(s) sera igual a
z p, donde un resultado negativo significa numero de vueltas antihorarias.
Suponga que tal numero de vueltas es igual a z, es decir, z p = z. Esto
implicara que p = 0, es decir, no habra ningun polo de lazo cerrado en el
semiplano derecho y por tanto se asegurara estabilidad del sistema en lazo
cerrado. Esta es la idea fundamental detras del criterio de Nyquist que se des-
arrolla a continuacion. Sin embargo, algunas sutilezas deben ser consideradas
antes.

Im (s)
+1

r!1

0 Re (s)

Figura 6.33. Trayectoria de Nyquist.


6.5 Criterio de estabilidad de Nyquist 331

El criterio de Nyquist fue desarrollado bajo la siguiente consigna. Dado un


sistema en lazo cerrado, la funcion de transferencia de lazo abierto G(s)H(s)
es conocida (planta y controlador) pero la funcion de transferencia de lazo
G(s)
cerrado 1+G(s)H(s) es desconocida. Es decir, aun cuando los polos y ceros de
G(s)
G(s)H(s) son conocidos, los polos de 1+G(s)H(s) son desconocidos. Si se cono-
G(s)
cieran los polos de 1+G(s)H(s) el problema de estabilidad ya estara resuelto y
cualquier criterio de estabilidad estara de mas. Entonces, una de las consignas
del criterio de Nyquist es determinar la estabilidad en lazo cerrado a partir
del conocimiento de la funcion de transferencia de lazo abierto solamente.
G(s)
Lo anterior significa que la funcion 1+G(s)H(s) no puede ser evaluada mien-
tras se hace el recorrido de la trayectoria de Nyquist como se describe en los
parrafos anteriores. Esto implica que no puede conocerse el numero de vueltas
G(s)
obtenidas al rededor del origen de 1+G(s)H(s) y, por tanto, dicho metodo debe
ser modificado. Esto es lo que se hace en las siguientes secciones.

6.5.3. Polos y ceros

Considere la funcion de transferencia del sistema en lazo cerrado de la


figura 6.32:

C(s) G(s)
= (6.28)
R(s) 1 + G(s)H(s)

Los polos del sistema en lazo cerrado son los ceros de 1 + G(s)H(s). Re-
cuerdese que los polos de lazo cerrado son los valores de s que satisfacen
1 + G(s)H(s) = 0.
Los polos de G(s)H(s) (polos de lazo abierto) tambien son los polos de
1 + G(s)H(s). Notese que si G(s)H(s) entonces 1 + G(s)H(s)
tambien.

6.5.4. Criterio de Nyquist. Caso especial

Suponga que G(s)H(s) tiene P polos en el semiplano derecho (polos de


lazo abierto inestables con parte real positiva), es decir, de acuerdo a la seccion
previa, la funcion 1+G(s)H(s) tiene P polos en el semiplano derecho. Tambien
suponga que la funcion 1 + G(s)H(s) tiene Z ceros en el semiplano derecho
(polos de lazo cerrado inestables). Suponga que, una vez que se recorre en
sentido horario la trayectoria de Nyquist, se obtienen N vueltas alrededor del
origen del plano 1 + G(s)H(s), es decir N = Z P . Si N = P < 0 es
decir, si se consiguen P vueltas antihorarias alrededor del origen del plano
1 + G(s)H(s) entonces el numero de polos de lazo cerrado inestables es cero,
Z = 0, y se asegura la estabilidad del sistema en lazo cerrado.
Solo falta un pequeno detalle para terminar de establecer el criterio de
Nyquist. El origen del plano 1+G(s)H(s) satisface la condicion 1+G(s)H(s) =
332 6 Diseno usando la respuesta en frecuencia

0 que equivale a G(s)H(s) = 1. Por tanto, el origen del plano 1 + G(s)H(s)


corresponde al punto (1, j0) del plano G(s)H(s). Esto significa que el numero
de vueltas N alrededor del origen del plano 1+G(s)H(s) es identico al numero
de vueltas alrededor del punto (1, j0) en el plano G(s)H(s). Esto es algo
muy conveniente porque solo se requiere conocer G(s)H(s) (en lugar de 1 +
G(s)H(s)).
Finalmente, notese que si G(s)H(s) es una funcion que tiene un numero de
polos que es mayor o igual al numero de ceros, entonces lms G(s)H(s) =
constante. Esto significa que mientras se recorre toda la parte semicircular
de radio infinito de la trayectoria de Nyquist la funcion G(s)H(s) representa
un unico punto. Entonces, la parte realmente interesante de G(s)H(s) es la
que se obtiene durante el recorrido del eje imaginario, desde j = j has-
ta j = +j. Notese que durante este recorrido G(s)H(s) se convierte en
G(j)H(j) lo que representa la grafica polar del sistema en lazo abierto que
ya se ha aprendido a dibujar. Todo lo anterior permite establecer el siguiente
criterio.

Criterio de Nyquist. Caso especial en el que G(s)H(s) no tiene polos


y/o ceros sobre sobre el eje imaginario.
En el sistema de lazo cerrado mostrado en la figura 6.32, si la funcion de trans-
ferencia de lazo abierto G(s)H(s) tiene P polos en el semiplano derecho del
plano s y lms G(s)H(s) = constante, entonces para que haya estabilidad
en lazo cerrado la grafica polar de G(j)H(j) (al variar de a +)
debe rodear P veces en sentido antihorario al punto (1, j0).

La clave para recordar el criterio de Nyquist es expresandolo en la forma:

Z =N +P

donde P representa el numero de polos de lazo abierto inestables, Z representa


el numero de polos de lazo cerrado inestables y N representa el numero de
vueltas que la grafica polar G(j)H(j) realiza alrededor del punto (1, j0),
cuando vara desde hasta +. Un valor positivo de N representa
vueltas horarias y mientras que un valor negativo de N representa vueltas
antihorarias. La estabilidad en lazo cerrado se asegura cuando Z = 0, es decir
cuando N = P .

6.5.5. Criterio de Nyquist. Caso general

El truco del recorrido cerrado introducido en la seccion 6.5.1 solo es


valido si dicho recorrido contiene por completo a los polos y ceros en cuestion.
As que no es aplicable en el caso en que un polo o un cero estan sobre el
recorrido cerrado. Notese que en el caso en que la funcion de lazo abierto
G(s)H(s) tiene polos o ceros sobre el eje imaginario la trayectoria de Nyquist
contiene a dichos polos o ceros por lo que el criterio establecido en la seccion
6.5 Criterio de estabilidad de Nyquist 333

6.5.4 no es aplicable. Este problema se resuelve definiendo un nuevo recorrido


conocido como la trayectoria de Nyquist modificada que se muestra en la
figura 6.34. Esta trayectoria es identica a la trayectoria de Nyquist introducida
en la figura 6.33 y solo difiere de esta en los puntos que contienen a los polos
o ceros de G(s)H(s) sobre el eje imaginario. La idea es rodear tales puntos
usando una trayectoria semicircular de radio pequeno 0 que describe
un angulo que vara de 90o a +90o . La razon de introducir un radio muy
pequeno es el asegurar que la trayectoria de Nyquist modificada encierre por
completo a cualquier posible polo o cero de lazo cerrado (desconocidos) que se
encuentren en el semiplano derecho cerca del eje imaginario. La forma general
del criterio de Nyquist puede establecerse del siguiente modo.

Im (s)

r!1
polos y
ceros de
G (s ) H (s ) Re (s)

Figura 6.34. Trayectoria de Nyquist modificada.

Criterio de Nyquist. Caso general en el que G(s)H(s) tiene polos y/o


ceros sobre sobre el eje imaginario.
En el sistema de lazo cerrado mostrado en la figura 6.32, si la funcion de
transferencia de lazo abierto G(s)H(s) tiene P polos en el semiplano derecho
del plano s, entonces para que haya estabilidad en lazo cerrado, cuando un
punto representativo s recorre la trayectoria de Nyquist modificada en sentido
horario la grafica de G(s)H(s) debe rodear P veces en sentido antihorario al
334 6 Diseno usando la respuesta en frecuencia

punto (1, j0).

Es importante subrayar que en este caso tambien se requiere que G(s)H(s)


constante cuando s , es decir, que G(s)H(s) tenga un numero de polos
mayor o igual al numero de sus ceros. Ademas, tambien sigue aplicandose la
relacion Z = N + P con Z el numero de polos inestables de lazo cerrado, P el
numero de polos inestables de lazo abierto y N el numero de vueltas alrededor
del punto (1, j0).

6.6. Margenes de estabilidad


El criterio de Nyquist es valido para sistemas cuyas funciones de trans-
ferencia son de fase mnima o de fase no mnima, es decir, se trata de un
resultado que se puede aplicar a cualquier caso. Sin embargo, lo que a conti-
nuacion se describe se hace suponiendo que el sistema tiene una funcion de
transferencia de lazo abierto de fase mnima (todos los polos y ceros tienen
parte real menor o igual que cero), pues esta consideracion simplifica grande-
mente la exposicion de las ideas.
Si el sistema es de fase mnima entonces P = 0 por lo que la estabilidad de
lazo cerrado queda asegurada si N = 0, entonces el criterio de Nyquist puede
simplificarse a lo siguiente:
Considere que la frecuencia vara unicamente desde 0 hasta +. Trace
la grafica polar de G(s)H(s) correspondiente a estas frecuencias. Suponga
que esta grafica representa un camino que usted puede recorrer sobre el papel
desde = 0 hasta +. Si el punto (1, j0) queda a la izquierda de
dicho camino recorrido entonces el sistema en lazo cerrado es estable. Si tal
punto queda a la derecha entonces hay inestabilidad.
Ante esta descripcion salta a la vista la siguiente pregunta: Que sucede si
la grafica polar obtenida pasa exactamente sobre el punto (1, j0)? En tal caso
se dice que se esta en el lmite de la estabilidad, lo que significa que hay polos
de lazo cerrado que tienen parte real cero. En base a esto se puede afirmar que
mientras el punto (1, j0) este mas lejos de la grafica polar de G(s)H(s)|s=j
pero siempre a su izquierda entonces el sistema en lazo cerrado sera mas
estable (mas lejos de la inestabilidad). A la lejana que guarda el sistema en
lazo cerrado respecto a la inestabilidad se le llama margen de estabilidad y
existen dos maneras de medir dicha lejana: el margen de fase y el margen de
ganancia.
Margen de fase. Es la cantidad de atraso de fase que se requiere anadir
a la frecuencia de cruce de ganancia 1 , para llevar el sistema al bor-
de de la inestabilidad. La frecuencia de cruce de ganancia es aquella a
la cual |G(j1 )H(j1 )| = 1. Sea Kf el margen de fase y la fase de
G(j1 )H(j1 ), entonces:

Kf = 180o +
6.6 Margenes de estabilidad 335

En la figura 6.35 puede observarse que un margen de fase negativo implica


inestabilidad en lazo cerrado, mientras que un margen de fase positivo im-
plica estabilidad en lazo cerrado. De acuerdo a estos razonamientos un cero
que se agregue en lazo abierto tiende a mejorar la estabilidad del sistema
en lazo cerrado porque introduce una fase positiva, es decir, incrementa o
hace positivo el valor de Kf . Notese que, de acuerdo a las graficas en las
figuras 6.13 y 6.15, el adelanto de fase debido un cero es mayor para una
frecuencia especfica conforme la frecuencia de esquina es menor (la cual es
numericamente igual al valor absoluto de la ubicacion del cero). Por tanto,
el efecto estabilizante del cero de lazo abierto aumenta conforme este se
coloca mas cerca del origen (dentro del semiplano izquierdo).
Por otro lado, un polo que se agregue en lazo abierto tiende a hacer menos
estable al sistema en lazo cerrado porque introduce una fase negativa, es
decir, disminuye o hace negativo el valor de Kf . Notese que, de acuer-
do a las graficas en las figuras 6.13 y 6.15, el atraso de fase debido un
polo es mayor para una frecuencia especfica conforme la frecuencia de
esquina es menor (la cual es numericamente igual al valor absoluto de la
ubicacion del polo). Por tanto, el efecto inestabilizante del polo de lazo
abierto aumenta conforme este se coloca mas cerca del origen (dentro del
semiplano izquierdo).
Margen de ganancia. Sea Kg el margen de ganancia, entonces:

1
Kg =
|G(j2 )H(j2 )|

donde 2 representa la frecuencia en la que la fase de G(j2 )H(j2 ) es


180[grados ] (2 tambien es conocida como frecuencia de cruce de fase).
En la figura 6.35 puede observarse que Kg > 1 (20 log(Kg ) > 0[dB])
implica estabilidad en lazo cerrado, mientras que Kg < 1 (20 log(Kg ) <
0[dB]) implica inestabilidad en lazo cerrado.

Es importante resaltar que los margenes de fase y de ganancia estan definidos


sobre las graficas de respuesta en frecuencia de la funcion de transferencia
de lazo abierto y, sin embargo, dan informacion sobre la estabilidad y las
caractersticas de respuesta transitoria del sistema en lazo cerrado.
336 6 Diseno usando la respuesta en frecuencia

dB dB
!1 !1
0 ! 0 !2 !
!2

fase fase
[grados] ! [grados] 0 !
0
90 90
180 180
(a) Estabilidad en lazo cerrado. (b) Inestabilidad en lazo cerrado.

Im (G (j! ) H (j! ) )

!! +1
1
1 Kg Re (G (j! ) H (j! ) )
! = 0+

(c) Estabilidad en lazo cerrado.

Im (G (j! ) H (j! ) )

1
Kg !! +1

1 Re (G (j! ) H (j! ) )
! = 0+

(d) Inestabilidad en lazo cerrado.

Figura 6.35. Respuesta en frecuencia de G(j)H(j). Los margenes de fase y de


ganancia se determinan a partir de la respuesta en frecuencia obtenida a partir de
la funcion de transferencia de lazo abierto.

6.7. Relacion entre las caractersticas de respuesta en


la frecuencia y en el tiempo
Como se menciona en el captulo 5, la respuesta de un sistema de control
se compone de dos partes: la respuesta transitoria y la respuesta en estado es-
6.7 Relacion entre las caractersticas de respuesta en la frecuencia y en el tiempo 337

tacionario. Es importante saber como se relacionan las caractersticas de estas


respuestas en el tiempo con las caractersticas de la respuesta en frecuencia
del sistema a controlar, a fin de saber que es lo que se debe modificar en estas
ultimas para poder disenar adecuadamente las primeras. A continuacion se
describen los puntos mas sobresalientes de esta relacion.

6.7.1. Respuesta en lazo abierto


Existe una relacion muy estrecha entre las caractersticas de respuesta en
frecuencia de un sistema en lazo abierto y las caractersticas de respuesta en
el tiempo del mismo sistema en lazo abierto, como se describe a continuacion.
1. La altura del pico de resonancia Mr esta relacionada inversamente con
el valor del amortiguamiento, : cuanto mayor es Mr menor es (vease
la figura 6.14(b)). Recuerdese que menores amortiguamientos producen
mayores sobre pasos, Mp ( %), en la respuesta en el tiempo cuando se aplica
un escalon. Por tanto, el sobre paso es mayor (y el sistema presenta mas
oscilaciones) conforme Mr es mayor. En terminos muy generales puede
afirmarse que cuando 1.0 < Mr < 1.4 (0[dB]< Mr < 3[dB]) entonces el
amortiguamiento esta en el rango 0.7 > > 0.4 [3] pag. 571, [4] pag. 637.
2. La magnitud de la frecuencia de esquina indica la velocidad de respuesta
del sistema [3] pag. 573, [4] pag 638. Recuerdese que en un sistema de
segundo orden la frecuencia de esquina es n la cual, cuando aumenta,
reduce el tiempo de subida (vease la seccion 3.3). En el caso de un sistema
de primer orden la frecuencia de esquina es igual al valor absoluto del polo
del sistema. De acuerdo a la seccion 3.1 el tiempo de respuesta (constante
de tiempo) se reduce si el valor absoluto del polo tiene un valor mayor.
En el caso general de un sistema arbitrario de orden n se define el ancho
de banda para describir su rapidez de respuesta en el tiempo en terminos
de su respuesta en frecuencia. El ancho de banda es la frecuencia a la cual
la magnitud de la funcion de transferencia se reduce en 3[dB] respecto
de su magnitud a frecuencia cero. La rapidez de respuesta en el tiempo
del sistema es mayor conforme su ancho de banda es mayor.
3. El valor final de la salida del sistema definido por Y (s) = G(s)U (s) ante
una entrada tipo escalon de altura A esta determinada por la respuesta
del sistema a frecuencia cero G(j)|=0 :
A
lm y(t) = lm sG(s) = G(0)A = |G(j0)|A
t s0 s
Notese que los dos ultimos puntos estan en completo acuerdo con lo examinado
en la seccion 6.1.4.

6.7.2. Respuesta en lazo cerrado


Tambien existe una relacion entre la respuesta en frecuencia de la funcion
de lazo abierto G(s)H(s) y la respuesta en el tiempo del sistema en lazo
338 6 Diseno usando la respuesta en frecuencia

cerrado C(s)
R(s) . Esta relacion es muy importante para el diseno de sistemas de
control realimentados.
1. El margen de fase Kf (medido a partir de la respuesta en frecuencia del
sistema en lazo abierto) se relaciona con el factor de amortiguamiento del
sistema en lazo cerrado de acuerdo a la siguiente tabla [3] pag. 570,[4] pag.
648:

Tabla 6.3. Relacion entre el margen de fase (lazo abierto) y el amortiguamiento de


un sistema en lazo cerrado.
Kf [grados] 0 11 23 33 43 52 59 65 70 74 76
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Notese que para el rango 0 0.6 se cumple aproximadamente que


K
= 100f . Debe aclararse que estas relaciones se calculan a partir de la
respuesta de un sistema de segundo orden sin ceros. Aunque para sistemas
de orden mayor y con ceros se esperan diferencias respecto a estos valores
sin embargo es posible considerarlos como directivas para el diseno.
2. A mayor frecuencia de cruce de ganancia (medida a partir de la respuesta
en frecuencia del sistema en lazo abierto) mayor es la rapidez del sistema
en lazo cerrado [3], pag. 571. Esto puede explicarse del siguiente modo. La
frecuencia de cruce de ganancia es la frecuencia a la cual |G(j)H(j)| =
0[dB] y generalmente esta magnitud disminuye al aumentar la frecuencia.
Por tanto, una mayor frecuencia de cruce de ganancia en lazo abierto
implica un mayor ancho de banda en lazo cerrado y esto ultimo implica
una mayor rapidez de respuesta del sistema en lazo cerrado.
3. El error en estado estacionario de la respuesta en lazo cerrado se obtiene
a partir de la respuesta de la funcion de lazo abierto a frecuencia cero.
Por ejemplo, si en el sistema en lazo cerrado se tiene que R(s) = A/s
entonces:
A
ess = lm [r(t) y(t)] = , kp = G(0)H(0) = |G(j)H(j)|=0
t 1 + kp

6.8. Ejemplos

6.8.1. Ejemplo de analisis

En esta parte se presenta un ejemplo de analisis usando la tecnica de la


respuesta en frecuencia. Este ejemplo es estudiado usando el metodo del lugar
de las races en la seccion 5.2.6.
6.8 Ejemplos 339

Analisis de estabilidad
Considere la siguiente funcion de transferencia:
116137 k
G(s)H(s) = (6.29)
s3 + 72.54s2 1250s 9.363 104
116137 k
=
(s 35.7377)(s + 36.5040)(s + 71.7721)
116137 k 35.7377 36.5040 71.7721
=
(35.7377)(36.5040)(71.7721) (s 35.7377) (s + 36.5040) (s + 71.7721)
Para este ejemplo es importante encontrar las caractersticas de respuesta en
frecuencia de la siguiente funcion de transferencia:
a
G1 (s) = , a>0
sa
Usando el cambio de variable s = j se puede obtener:
a
G1 (j) =
j a
a j a
=
j a j a
a(j a)
=
2 + a2

a 2 + a2
= atan
2 + a2 a

a
= atan
2 + a2 a

a
|G1 (j)| = , G1 (j) = atan
2 + a2 a
De aqu se encuentra que:
si = 0 : |G1 (j)| = 1, G1 (j) = 180o
si : |G1 (j)| 0, G1 (j) 90o
1
si = a : |G1 (j)| = , G1 (j) = 135o
2
Usando esta informacion y los resultados de la seccion 6.3 se obtienen las
graficas de Bode mostradas en la figura 6.36. Usando estas graficas de Bode
se obtiene la grafica polar de la figura 6.37. Es conveniente aclarar que tambien
es correcto decir que:
si = 0 : |G1 (j)| = 1, G1 (j) = +180o
si : |G1 (j)| 0, G1 (j) +270o
1
si = a : |G1 (j)| = , G1 (j) = +225o
2
340 6 Diseno usando la respuesta en frecuencia

Esto trae como consecuencia que en este caso la grafica de Bode de fase
este desplazada 360 hacia arriba respecto de la grafica de Bode de fase mos-
trada en la figura 6.36. Sin embargo, el lector puede verificar que la grafica
polar en ambos casos es identica a la mostrada en la figura 6.37. Por esta
razon, el analisis presentado en la siguiente subseccion para estudiar el efecto
de un compensador es valido en ambos casos.
Continuando con la figura 6.37, notese que para k mayores crece la dis-
tancia al origen de cualquier punto sobre la grafica polar. Por tanto, para k
pequenas se tiene que N = 0 y para k grandes se tiene N = 1. Notese que
el numero de polos inestables de lazo abierto es P = 1. Entonces, de acuer-
do al criterio de Nyquist el numero de polos inestables en lazo cerrado es
Z = P + N > 0. Esto significa que el sistema en lazo cerrado es inestable para
cualquier valor de k > 0. A continuacion se muestra que este problema puede
ser resuelto si se introduce convenientemente un adelanto de fase, es decir, si
se adiciona un cero a la funcion de transferencia de lazo abierto.

dB
i)
35:73 71:77 !
0 36:5
ii) iii) iv)

v)

fase
[grados]
35:73 36:5 71:77
0 !
iii) iv)
90
ii)
180

v)
270

116137 k
Figura 6.36. Graficas de Bode de G(s)H(s) en (6.29): i) (35.7377)(36.5040)(71.7721)
,
35.7377 36.5040 71.7721
ii) (s35.7377) , iii) (s+36.5040) , iv) (s+71.7721) , v) G(s)H(s).

Considere la siguiente funcion de transferencia de lazo abierto:


6.8 Ejemplos 341

Im (G(j!)H(j!))

!=0 ! ! +1

1 ! ! 1 0 Re (G(j!)H(j!))

Figura 6.37. Grafica polar de G(s)H(s) en (6.29).

116137(s + b)
G(s)H(s) = k (6.30)
s3
+ 72.54s2 1250s 9.363 104
116137(s + b)
=k
(s 35.7377)(s + 36.5040)(s + 71.7721)
116137 k b 35.7377 36.5040 71.7721 s + b
=
(35.7377)(36.5040)(71.7721) (s 35.7377) (s + 36.5040) (s + 71.7721) b
con b una constante positiva. Si se elige b < 35.7377 entonces se obtienen
las graficas de Bode mostradas en la figura 6.38 y con ellas la grafica polar
de la figura 6.39. Esto significa que si k es suficientemente grande entonces
N = 1 y como P = 1 entonces el sistema en lazo cerrado es estable porque
Z = P + N = 0.

Analisis usando graficas de Bode


En esta parte se usan las graficas de Bode para analizar las caractersticas
del sistema en lazo cerrado estudiado en la seccion 5.2.6. En la figura 6.40 se
muestran las graficas de Bode de la funcion de transferencia:
116137
s3 + 72.54s2 1250s 9.363 104
Notese que el adelanto de fase del polo en s = 35.73, y que se muestra en
la figura 6.36, no se aprecia en la figura 6.40 debido a la presencia del polo en
s = 36.50. Observese tambien que el margen de fase2 es negativo por lo que
2
De acuerdo a la seccion 6.6, el margen de fase y el margen de ganancia se definen
para sistemas de fase mnima y aunque el sistema aqu estudiado es de fase no
mnima (por el polo inestable en s = 35.7377), se utilizara el termino margen
de fase para indicar la comparacion de la fase del sistema respecto del valor
fundamental de 180 .
342 6 Diseno usando la respuesta en frecuencia

dB
i)
vi) 35:73 36:5 71:77 !
0
b
iii) iv)
ii)
v)
fase
[grados]
+ 90
vi)
35:73 36:5 71:77
0 !
b iii)
iv)
90

ii)
180 v)

116137 k b
Figura 6.38. Graficas de Bode de G(s)H(s) en (6.30): i) (35.7377)(36.5040)(71.7721) ,
35.7377 36.5040 71.7721 s+b
ii) (s35.7377) , iii) (s+36.5040) , iv) (s+71.7721) , v) G(s)H(s), vi) b , b < 35.7377.

Im (G(j!)H(j!))

!=0 ! ! 1

1 0 ! ! +1
Re (G(j!)H(j!))

Figura 6.39. Grafica polar de G(s)H(s) en (6.30).

el sistema en lazo cerrado es inestable. Tal como se describe en la subseccion


previa, se puede conseguir estabilidad en lazo cerrado si se introduce suficiente
adelanto de fase colocando en cascada un factor de la forma:
k(s + b) (6.31)
Al mismo tiempo, se puede hacer rapida la respuesta del sistema en lazo cerra-
do si se consigue una frecuencia de cruce de ganancia suficientemente grande.
Estas dos caractersticas pueden ser conseguidas si seleccionan adecuadamen-
te los valores de k y de b. Usando b =31.2463 y k =0.0396 determinados en
6.8 Ejemplos 343

Figura 6.40. Graficas de Bode del sistema sin compensar


116137
.
s3 +72.54s2 1250s9.363104

la seccion 5.2.6 se consigue lo siguiente. Para =38.5[rad/s] la magnitud y la


fase son de 5.85[dB] y 208[grados], respectivamente, en la figura 6.40. La
figura 6.41 muestra que a esta misma frecuencia la magnitud y la fase son de
5.87[dB] y 50.9[grados] para el factor en (6.31). En la figura 6.42 se muestra
que con esto se consigue que la funcion de transferencia G(s)H(s) mostrada
en (6.30) tenga una magnitud de 0[dB] y una fase de 157[grados] cuando
=38.5[rad/s]. Esto significa que el sistema en lazo cerrado tiene un margen
de fase de 23[grados]. De acuerdo a la seccion 6.7.2, si el sistema fuera de
segundo orden y sin ceros, esto correspondera a un amortiguamiento en lazo
cerrado de aproximadamente 0.2. As que, aunque el sistema estudiado es de
tercer orden y tiene un cero, es de esperarse que la respuesta del sistema en
lazo cerrado este poco amortiguada.
344 6 Diseno usando la respuesta en frecuencia

Figura 6.41. Graficas de Bode del compensador k(s + b), b =31.2463, k =0.0396.

6.8.2. Un sistema ball and beam

En esta parte se presenta un ejemplo de diseno usando la tecnica de la


respuesta en frecuencia. Este ejemplo constituye la aplicacion a un prototipo
conocido como ball and beam el cual es construido y controlado experimen-
talmente en el captulo 12.

Analisis de estabilidad

Considere el diagrama de bloques mostrado en la figura 6.43, donde Ax , a,


, y k son constantes positivas. La funcion de transferencia de lazo abierto
esta dada como:
Ax k a 1
G(s)H(s) = (6.32)
a s + a s3

Esta funcion de transferencia de lazo abierto tiene tres polos en el origen, es


decir sobre el eje imaginario del plano complejo s. Por tanto, se debera utilizar
6.8 Ejemplos 345

Figura 6.42. G(s)H(s) en (6.30), b =31.2463 y k =0.0396.

Xd (s) k X(s)
Ax
+ s ( s+ a ) s2

Figura 6.43. Sistema en lazo cerrado. Primera propuesta.

la trayectoria de Nyquist modificada que se muestra en la figura 6.44. La


grafica polar de G(s)H(s), dada en (6.32), obtenida al recorrer la trayectoria
de Nyquist modificada se muestra en la figura 6.45. A continuacion se explica
como se obtiene esta grafica polar.
En la figura 6.23 se muestra la grafica polar de (6.32). Para considerar el
rodeo alrededor de s = 0 que incluye la trayectoria de Nyquist modificada se
procede del siguiente modo. En primer lugar se hace el cambio de variable
s = en la funcion de transferencia (6.32) para obtener:
346 6 Diseno usando la respuesta en frecuencia

Im (s)
j!

! = 0+
= + 90
s="
"

Re (s)
r!1
! = 0
= 90

j!

Figura 6.44. Trayectoria de Nyquist modificada usada en la seccion 6.8.2.

Ax k 1
G(s)H(s) = 3
+ a 3
Como 0 es un valor constante muy pequeno se puede considerar que
a para aproximar:
Ax k
G(s)H(s) = 3 = 1 3
a3
donde 1 = Aax3k + es una constante real muy grande porque 0. Por
otro lado, vara desde 90 (cuando = 0 ) hasta +90 (cuando = 0+ ).
Entonces se tiene que:

1 + 270, cuando = 0
G(s)H(s) = 1 3 = (6.33)
1 270, cuando = 0+
Esto explica la presencia de las circunferencias de radio infinito que aparecen
en la figura 6.45 y que, de acuerdo a (6.33), deben ser recorridas en sentido
horario al pasar desde = 0 hasta = 0+ .
6.8 Ejemplos 347

Im (G (j! ) H (j! ) )

270 o
! = 0+

r!1
!! +1

1 !! 1 Re (G (j! ) H (j! ) )

+ 270 o
!=0

Figura 6.45. Grafica polar de G(s)H(s) en (6.32) obtenida al recorrer la trayectoria


de Nyquist modificada mostrada en la figura 6.44.

Notese que P = 0 porque G(s)H(s) dada en (6.32) no tiene polos con


parte real positiva y que N = 2 porque al recorrer la trayectoria de Nyquist
modificada en el sentido mostrado, la grafica polar en la figura 6.45 da dos
vueltas en sentido horario al punto (1, j0). Por tanto, la aplicacion del cri-
terio de Nyquist Z = N + P = 2 indica que existen dos polos de lazo cerrado
que estan en el semiplano complejo derecho y, por tanto, el sistema en lazo
cerrado de la figura 6.43 es inestable. Notese tambien que debido a que en la
figura 6.45 hay circunferencias de radio infinito este resultado no cambia aun
cuando se redujera el valor de la ganancia:
Ax k
(6.34)
a
reduciendo por ejemplo el valor del parametro . Esto se debe a que el valor
de 1 tiende a infinito para cualquier valor finito de (6.34) porque 0 y,
por tanto, se sigue cumpliendo que P = 0, N = 2 y Z = 2.

Xd (s) k X(s)
Ax s+
s+ c s ( s+ a ) s2
+

Figura 6.46. Sistema en lazo cerrado. Segunda propuesta.


348 6 Diseno usando la respuesta en frecuencia

Ahora considere el diagrama de bloques mostrado en la figura 6.46, donde


y c son constantes positivas. La motivacion para usar este diagrama de
bloques es el tratar de conseguir estabilidad en lazo cerrado mediante el uso
de un controlador PD con funcion de transferencia (s + ). Sin embargo,
en lugar de un controlador PD se propone usar una red de adelanto con
funcion de transferencia s+
s+c con < c pues este tipo de controlador reduce
el efecto del ruido que introduce un controlador PD. En este caso la funcion
de transferencia de lazo abierto esta dada como:
Ax k s + c a 1
G(s)H(s) = (6.35)
ac s + c s + a s3
Esta funcion de transferencia de lazo abierto tambien tiene tres polos en el
origen, es decir sobre el eje imaginario del plano complejo s y, por tanto, se
debera utilizar la trayectoria de Nyquist modificada que se muestra en la figura
6.44. La grafica polar de G(s)H(s), dada en (6.35), obtenida al recorrer la
trayectoria de Nyquist modificada se muestra en la figura 6.47. A continuacion
se explica como se obtiene esta grafica polar.

Im (G (j! ) H (j! ) )

270 o+
!=0

1 !! +1

r!1 !! 1 Re (G (j! ) H (j! ) )

o
+ 270
!=0

Figura 6.47. Grafica polar de G(s)H(s) en (6.35) obtenida al recorrer la trayectoria


de Nyquist modificada mostrada en la figura 6.44.

En la figura 6.25 se muestra la grafica polar de (6.35). Para considerar el


rodeo al rededor de s = 0 que incluye la trayectoria de Nyquist modificada se
procede del siguiente modo. Primero se hace el cambio de variable s =
en la funcion de transferencia (6.35) para obtener:
+ 1
G(s)H(s) = Ax k 3
( + c)( + a) 3
6.8 Ejemplos 349

Como 0 es un valor constante muy pequeno se puede considerar que


a , c y para aproximar:
Ax k
G(s)H(s) = 3 = 2 3
ac3
donde 2 = Aac
x k
3 + es una constante muy grande porque 0. Por
otro lado, vara desde 90 (cuando = 0 ) hasta +90 (cuando = 0+ ).
Entonces se tiene que:

2 + 270, cuando = 0
G(s)H(s) = 2 3 = (6.36)
2 270, cuando = 0+
Esto explica la presencia de las circunferencias de radio infinito que aparecen
en la figura 6.47 y que, de acuerdo a (6.36), deben ser recorridas en sentido
horario al pasar desde = 0 hasta = 0+ .
Notese que, de nuevo, P = 0, N = 2 y Z = N + P = 2. Por tanto, existen
dos polos de lazo cerrado que tienen parte real positiva y el sistema en lazo
cerrado es inestable. Ademas, usando argumentos similares al los usados en el
ejemplo anterior, se concluye que la inestabilidad no se puede corregir dando
valores pequenos a la siguiente ganancia:
Ax k
(6.37)
ac
As que ni el uso de una red de adelanto es suficiente para conseguir esta-
bilidad en lazo cerrado. Es momento entonces de analizar cuidadosamente lo
que esta sucediendo. Recuerdese que en la seccion 6.6 se menciono que cuando
se introduce un polo de lazo abierto (con parte real negativa) el sistema en
lazo cerrado se acerca hacia la inestabilidad. Tambien se dijo que este efec-
to inestabilizante crece conforme dicho polo se coloca mas cerca del origen.
Ahora observe que las funciones de transferencia en (6.32) y en (6.35) tienen
tres polos en el origen. Entonces es razonable preguntarse si los problemas de
inestabilidad que se han encontrado hasta ahora son debidos a que la funcion
de transferencia de lazo abierto tiene demasiados polos en el origen.

Xd (s) s+ b + + k X(s)
Ax s+ c

s ( s+ a )
s2
+ 1 2

k s A

Figura 6.48. Sistema en lazo cerrado. Tercera propuesta.

Considere el diagrama de bloques de la figura 6.48, donde , A , kv , b


y c son constantes positivas. El objetivo de los dos lazos internos alrededor
350 6 Diseno usando la respuesta en frecuencia

k
de la funcion de transferencia s(s+a) es sacar uno de los polos del origen re-
corriendolo hacia la izquierda. Notese tambien que la red de adelanto esta dada
como:
s+b
Gc (s) = , 0<b<c (6.38)
s+c
La funcion de transferencia entre los puntos 1 y 2 de la figura 6.48 esta dada
como:
k
Gm (s) =
s2 + (a + kv kA )s + kA

Por tanto, la funcion de transferencia de lazo abierto es:


Ax b s + b c kA 1
G(s)H(s) = (6.39)
cA b s + c s + (a + kv kA )s + kA s2
2

Notese que esta funcion de transferencia de lazo abierto tiene dos polos en el
origen, es decir sobre el eje imaginario del plano complejo s y, por tanto, se
debera utilizar la trayectoria de Nyquist modificada que se muestra en la figura
6.44. La grafica polar de G(s)H(s), dada en (6.39), obtenida al recorrer la
trayectoria de Nyquist modificada se muestra en la figura 6.49. A continuacion
se explica como se obtiene esta grafica polar.

Im (G (j! ) H (j! ) )


+ 180 ! = 0 ! ! +1

180 ! = 0 + 1 ! ! 1 Re (G (j! ) H (j! ) )
r!1

Figura 6.49. Grafica polar de G(s)H(s) en (6.39) obtenida al recorrer la trayectoria


de Nyquist modificada mostrada en la figura 6.44.

En la figura 6.27 se muestra la grafica polar de (6.39). Para considerar el


rodeo alrededor de s = 0 que incluye la trayectoria de Nyquist modificada se
6.8 Ejemplos 351

procede del siguiente modo. Primero se hace el cambio de variable s =


en la funcion de transferencia (6.39) para obtener:

+ b k 1
G(s)H(s) = Ax (6.40)
2
+ c 2 2 + (a + kv kA ) + kA 2

Como 0 es un valor constante muy pequeno se puede aproximar:


Ax b
G(s)H(s) = 2 (6.41)
cA 2

donde 3 = AcAx b

2 + es una constante muy grande porque 0. Por
otro lado, vara desde 90 (cuando = 0 ) hasta +90 (cuando = 0+ ).
Entonces se tiene que:

3 + 180, cuando = 0
G(s)H(s) = 3 2 = (6.42)
3 180, cuando = 0+

Esto explica la presencia de la circunferencia de radio infinito que aparece en


la figura 6.49 y que, de acuerdo a (6.42), debe ser recorrida en sentido horario
al pasar desde = 0 hasta = 0+ .
Notese que ahora se tiene P = 0, N = 0 y Z = N + P = 0. Por tanto,
no existe ningun polo de lazo cerrado con parte real positiva y entonces el
sistema en lazo cerrado es estable.

Diseno usando graficas de Bode

Considere los siguientes valores numericos:

k = 16.51, a = 3.04, A = 1.43, (6.43)


Ax = 5.64, = 5, = 4, kv = 0.2

Las constantes y kv forman parte del controlador a disenar, por lo que se


requiere de un criterio para su seleccion. Sin embargo, este criterio depende de
aspectos practicos y solo puede definirse en base a las condiciones del prototipo
experimental que se va a controlar. En el captulo 12 se define dicho criterio
y se explica como se pueden seleccionar y kv . En la figura 6.50 se muestran
las graficas de Bode de la siguiente funcion de transferencia:
Ax kA 1
(6.44)
A s + (a + kv kA )s + kA s2
2

las cuales son obtenidas usando los valores presentados en (6.43). Puede verse
que la fase es aproximadamente igual a 208 grados cuando la magnitud es
igual a 0[dB] (cuando = 4.8[rad/s]). Esto significa que el margen de fase
es negativo y, por tanto, el sistema en lazo cerrado obtenido con (6.44) como
funcion de transferencia de lazo abierto sera inestable. Con el fin de estabilizar
352 6 Diseno usando la respuesta en frecuencia

Bode Diagram

50

System: gh
Frequency (rad/sec): 4.84
Magnitude (dB): 0.0804
0
Magnitude (dB)

50

100
180

225 System: gh
Frequency (rad/sec): 4.84
Phase (deg): 208
Phase (deg)

270

315

360
0 1 2
10 10 10
Frequency (rad/sec)

Figura 6.50. Graficas de Bode de la funcion de transferencia en (6.44)

el sistema en lazo cerrado se introduce el compensador presentado en (6.38),


por lo que la funcion de transferencia en lazo abierto del sistema compensado
es la presentada en (6.39).
El compensador en (6.38) se disena bajo el criterio de que el margen de
fase del sistema compensado sea de 20 grados. Esto representa un margen de
fase razonable y no requiere un adelanto de fase excesivo. Mas adelante se
mencionan las desventajas de introducir demasiado adelanto de fase. Eljase
= 4.8[rad/s] como la frecuencia a la cual el sistema en lazo abierto compen-
sado debe tener una magnitud de 0[dB]. Notese lo siguiente:
El sistema sin compensar tiene una fase de 208 grados y una magnitud
de 0[dB] a la frecuencia = 4.8[rad/s]. Esto puede apreciarse en la figura
6.50.
El compensador en (6.38) debe introducir, a la frecuencia = 4.8[rad/s],
un adelanto de fase de 208160=48 grados, para tener un margen de fase
de 20 grados, y una magnitud igual a 0[dB], para que la magnitud del
sistema compensado sea de 0[dB] a la frecuencia = 4.8[rad/s].
En la figura 6.51 se muestran las graficas de Bode de la funcion de transferencia
(vease la seccion 6.4.1):
6.8 Ejemplos 353

s + T1
Gd (s) = 1 , = 0.14 (6.45)
s + T

Se elige un valor de = 0.14 porque en la figura 6.51 se observa que esto

!T

!T

!T

Figura 6.51. Graficas de Bode para Gd (s) en (6.45)

consigue que la red en (6.45) produzca un maximo adelanto de fase de apro-


ximadamente 48 grados. Esto ocurre cuando T = 2.6 lo cual introduce una
magnitud de aproximadamente 8.7[dB]. El valor de T se calcula del siguiente
modo:
2.6 2.6
T = = = 0.541
4.8
porque = 4.8[rad/s] es la frecuencia a la cual se debe introducir el adelanto
de fase de 48 grados. Por tanto, (6.45) toma la forma:
s + 1.84
Gd (s) =
s + 13.2
Notese que el compensador en (6.38) se puede obtener como:
354 6 Diseno usando la respuesta en frecuencia

Gc (s) = Gd (s) (6.46)

si se selecciona b = 1.84 y c = 13.2. El compensador Gc (s) debe introducir una


magnitud de 0[dB] a la frecuencia = 4.8[rad/s]. De acuerdo a (6.46), esta
cantidad esta dada como la suma en decibeles de la magnitud de la funcion
de transferencia Gd (s) a dicha frecuencia (es decir, 8.7[dB]) y el equivalente
en decibeles de la ganancia :

8.7[dB] + 20 log() = 0[dB]

Despejando se obtiene:
8.7
= 10 20 2.6

Finalmente, se puede escribir:


s + 1.84
Gc (s) = 2.6 (6.47)
s + 13.2
En la figura 6.52 se muestra la grafica de Bode del sistema compensado (6.39)
usando el controlador (6.47). Notese que la frecuencia de cruce de ganancia
es aproximadamente = 4.8[rad/s] y que el margen de fase es de aproxima-
damente 22 grados, lo cual comprueba que se satisfacen las especificaciones
de diseno. En la figura 6.53 se muestra la respuesta al escalon del sistema en
lazo cerrado de la figura 6.48 usando (6.47) y los valores numericos en (6.43).
Notese que la respuesta es poco amortiguada debido al pequeno margen de
fase. Sin embargo, este tipo de respuesta es satisfactoria en la practica para
un sistema ball and beam.
Finalmente, es conveniente aclarar los siguiente. La frecuencia de cruce
de ganancia (4.8[rad/s] en este ejemplo) determina la rapidez de respuesta
del sistema en lazo cerrado. Sin embargo, (exceptuando las aproximaciones
de segundo orden) no existe una regla exacta que permita calcular el valor
de la frecuencia de cruce de ganancia en funcion de la rapidez deseada. Lo
que se sabe es que aumentando esta frecuencia se obtienen respuestas mas
rapidas. Por otro lado, elegir una frecuencia de cruce de ganancia grande
tambien incrementa el efecto del ruido. As que es recomendable proponer una
frecuencia de cruce de ganancia, hacer el diseno con ella y al final verificar si la
rapidez en lazo cerrado es la deseada y si el efecto del ruido no es prohibitivo. Si
la respuesta fuera muy lenta y el efecto del ruido no es importante, entonces
propongase una frecuencia de cruce de ganancia mayor y repita el proceso
hasta obtener la rapidez y el desempeno que se deseen.
En este ejemplo se ha decidido no intentar mejorar la rapidez de los resul-
tados obtenidos en la figura 6.53. Por un lado, puede observarse en esta figura
que el sistema alcanza el reposo en casi 3[s] lo cual es un tiempo muy bueno
para un sistema ball and beam en la practica. Por otro lado, de acuerdo a la
figura 6.50, si se elige una frecuencia de cruce de ganancia mayor entonces se
necesitara incrementar el adelanto de fase que debe introducir el compensador
6.8 Ejemplos 355

Bode Diagram

20

0
System: ghctrl
Frequency (rad/sec): 4.68
20 Magnitude (dB): 0.00958
Magnitude (dB)

40

60

80

100
135

180 System: ghctrl


Frequency (rad/sec): 4.68
Phase (deg): 158
Phase (deg)

225

270

315

360
0 1 2
10 10 10
Frequency (rad/sec)

Figura 6.52. Graficas de Bode del sistema ball and beam compensado.

Gc (s) (o equivalentemente Gd (s)). Esto implica elegir un valor de menor que


el utilizado, es decir 0.14, que dicho sea de paso ya es un valor pequeno. El
problema de usar valores pequenos de es que se incrementa el efecto del
ruido en el sistema de control lo cual, como se explica en el captulo 12, es
una limitante en la practica. De hecho, el haber elegido = 4.8[rad/s] como
frecuencia de cruce de ganancia responde a la necesidad de poder conseguir
un margen de fase satisfactorio (20 grados) sin usar un valor de demasiado
pequeno.

6.8.3. Control PD de posicion de un motor de CD


Considere el modelo de un motor de CD presentado en (5.12), captulo 5,
el cual se reescribe a continuacion:
k
(s) = I (s) (6.48)
s(s + a)
b nkm
a = > 0, k = >0
J J
donde (s) e I (s) representan la posicion (salida) y la consigna de corriente
(entrada), respectivamente. Las graficas de Bode correspondientes a la funcion
356 6 Diseno usando la respuesta en frecuencia

Step Response
2

1.8

1.6

1.4

1.2
Amplitude

0.8

0.6

0.4

0.2

0
0 0.5 1 1.5 2 2.5 3
Time (sec)

Figura 6.53. Respuesta del sistema en la figura 6.48 ante una referencia xd = 1[m].
La senal graficada es x(t).

de transferencia:
k
G(s) = (6.49)
s(s + a)
se muestran en la figura 6.54. Usando este resultado se obtiene la grafica polar
mostrada en la figura 6.55, la cual corresponde al recorrido de la trayectoria
de Nyquist modificada mostrada en la figura 6.56. Es conveniente aclarar que
G(s) tiene un polo sencillo en s = 0 y eso da origen al semicrculo de radio
infinito que aparece en la figura 6.55. Esto se consigue de manera similar a
como se procedio en la seccion 6.8.2. Es decir, se hace el cambio de variable
s = para reescribir (6.49) como:
k k k
G(s) = = =
( + a) (a) a
Recordando que 0 y que pasa de 90 a +90 conforme se hace el
rodeo alrededor de s = 0, mostrado en la figura 6.56, entonces se obtiene el
semicrculo de radio infinito que aparece en la figura 6.55. Debido a que la fase
de G(j) tiende asintoticamente a 180 conforme +, es claro que
la grafica polar mostrada en la figura 6.55 nunca rodeara al punto (1, j0)
para cualquier valor positivo de k y a. Es decir N = 0. Como G(s) no tiene
polos en el semiplano derecho, entonces P = 0. Por esta razon, si se cierra el
lazo alrededor de G(s) agregando una ganancia kp positiva para obtener un
6.8 Ejemplos 357

sistema de control de posicion proporcional, entonces el sistema de control en


lazo cerrado sera estable para cualquier kp positiva porque Z = N + P = 0.
Sin embargo, para valores mayores de kp , la grafica polar de la figura 6.55 se
aproxima mas y mas al punto (1, j0) por lo que el margen de fase disminuye
(notese que el margen de ganancia es infinito ya que el eje real negativo es
tocado solo en el origen). Como consecuencia, la respuesta es mas rapida pero
cada vez oscila mas (lo cual coincide con lo concluido en la seccion 5.2.1). Con
el fin de conseguir una respuesta en el tiempo que sea rapida (usando valores
de kp mayores) pero suficientemente amortiguadas, a continuacion se realiza
el diseno de un controlador proporcional-derivativo (PD).

dB
i)
a !
0
1 ii)
iii)
iv)

fase
[grados] a !
0
iii)
90 ii)
180 iv)

Figura 6.54. Graficas de Bode de G(s) presentada en (6.49). i) ka , ii) 1s , iii) s+a
a
,
k
iv) s(s+a) .

Considere el modelo de un motor de CD, presentado en (6.48), junto con


el siguiente controlador proporcional-derivativo:
de
i = kp e + kd
, e = d
dt
Aplicando la transformada de Laplace se obtiene:
I (s) = (kp + kd s)E(s), E(s) = d (s) (s)
El diagrama de bloques del sistema de control en lazo cerrado es se muestra
en la figura 6.57. La funcion de transferencia de lazo abierto es:

kp k
G(s)H(s) = kd s + (6.50)
kd s(s + a)
En particular, el controlador se puede reescribr, sucesivamente, del siguiente
modo:
358 6 Diseno usando la respuesta en frecuencia

Im (G (j!)) ! = 0

!! 1
!! +1 Re (G (j!))

! = 0+

Figura 6.55. Grafica polar de G(s) presentada en (6.49).

Im (s)
j!

! = 0+
= + 90
s="
"

Re (s)
r!1
! = 0
= 90

j!

Figura 6.56. Trayectoria de Nyquist modificada para la funcion de transferencia


en (6.49).
6.8 Ejemplos 359

d(s) + I(s) (s)


kp k
kd s + k d s(s+a)

Figura 6.57. Sistema de control proporcional-derivativo de posicion.

I (s) kp
= kd (s + b), b = (6.51)
E(s) kd

s+b 1
= kd b = kd b s+1
b b

Definiendo el cambio de variable z = 1b s se tiene:

I (s)
= kd b(z + 1)
E(s)

En la figura 6.58 se muestran las graficas de Bode del factor z + 1. Notese que
el eje horizontal de estas graficas de Bode corresponde a 1b (vease la seccion
6.4.1). Por tanto, la funcion de transferencia de lazo abierto, dada en (6.50),
ahora se escribe como:
k
G(s)H(s) = kd b(z + 1) (6.52)
s(s + a)

Considere el caso del motor de CD estudiado experimentalmente en el captulo


10. Los valores numericos de este motor son:

k = 675.4471, a = 2.8681
k
Usando estos datos se obtienen las graficas de Bode del factor s(s+a) , las cuales
se muestran en la figura 6.59. En estas graficas se observa que la frecuencia
de cruce de ganancia es 1 = 25.9[rad/s] y que la fase a esa frecuencia es de
174 , que corresponde a un margen de fase de +6 . Como este margen de
fase es muy pequeno, la respuesta en el tiempo es muy oscilatoria cuando se
usa un controlador proporcional con kp = 1, lo cual se muestra en la figura
6.60. Notese que el tiempo de subida es tr = 0.0628[s] y el sobre paso es
Mp = 83 %. A continuacion se disena un controlador proporcional-derivativo
(PD) de modo que la respuesta en el tiempo, en lazo cerrado, mantenga el
mismo tiempo de subida tr = 0.0628[s] pero que el sobre paso sea Mp = 20 %.
Con el fin de mantener la misma rapidez de respuesta se propone mantener
la misma frecuencia de cruce de ganancia, es decir, se usara:

1 = 25.9[rad/s] (6.53)
360 6 Diseno usando la respuesta en frecuencia

Bode Diagram

25

20
Magnitude (dB)

15

10

System: gc
Frequency (rad/sec): 0.882
5
Magnitude (dB): 2.5

0
90
Phase (deg)

45

System: gc
Frequency (rad/sec): 0.882
Phase (deg): 41.4

0
1 0 1
10 10 10
Frequency (rad/sec)

Figura 6.58. Grafica de Bode del factor z + 1, donde z = 1b s.

Por otro lado, usando el sobre paso deseado Mp = 20 % y:


v
u
u ln2 M p( %)
u 100
=t
2 M p( %)
ln 100 + 2

se obtiene = 0.4559. Usando interpolacion lineal en la tabla 6.3 se encuentra


que este amortiguamiento corresponde a un margen de fase de:
Kf = +47.5 (6.54)
Como el margen de fase del motor sin compensar es de +6 , entonces se
necesita que el controlador introduzca un adelanto de fase de +47.5 6 =
41.5 . En la figura 6.58 se observa que esto sucede cuando 1b = 0.882. Por
tanto, el parametro b se obtiene forzando que esto suceda cuando = 1 =
25.9[rad/s], es decir:

b= = 29.3984
0.882 =25.9
Por otro lado, como se desea que el sistema compensado tenga la misma
frecuencia de cruce de ganancia que el sistema sin compensar, = 1 =
6.8 Ejemplos 361

Bode Diagram

20

15

10 System: gh
Frequency (rad/sec): 25.9
5
Magnitude (dB): 0.00458
Magnitude (dB)

10

15

20

25

30
160

165
Phase (deg)

170

175 System: gh
Frequency (rad/sec): 25.9
Phase (deg): 174

180
1 2
10 10
Frequency (rad/sec)

k
Figura 6.59. Grafica de Bode del factor s(s+a)
, donde k = 675.4471 y a = 2.8681.

25.9[rad/s], es necesario que el controlador completo introduzca una magnitud


de 0[dB] cuando = 1 . Esto se consigue imponiendo lo siguiente sobre la
magnitud del controlador completo:

|kd b(z + 1)|dB = 20 log(kd b) + |z + 1|dB = 0[dB] (6.55)

donde, de acuerdo a la figura 6.58, se debe usar |z +1|dB = 2.5[dB]. Por tanto,
despejando kd y realizando los calculos correspondientes se encuentra:
1 2.5
kd = 10 20 = 0.0255
b
Finalmente, usando (6.51) se obtiene:

kp = bkd = 0.7499

En la figura 6.61 se muestran las graficas de Bode de la funcion de transferencia


de lazo abierto del sistema compensado (mostrada en (6.50)). En esta figura
se puede verificar que la frecuencia de cruce de ganancia es = 25.9[rad/s] y
que la fase a esa frecuencia es 132 , lo cual corresponde a un margen de fase
de +48 . Esto significa que se han conseguido las especificaciones de respuesta
362 6 Diseno usando la respuesta en frecuencia

[rad] 1.8
System: Mc
Time (sec): 0.119
Amplitude: 1.83
1.6

1.4

1.2 System: Mc
Time (sec): 0.0628
Amplitude: 1
1

0.8

0.6

0.4

0.2

0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

tiempo [s]

Figura 6.60. Respuesta en el tiempo del sistema en lazo cerrado mostrado en la


figura 6.57 cuando kp = 1, kd = 0, k = 675.4471 y a = 2.8681.

en frecuencia establecidas en (6.53) y (6.54). Por otro lado, en la figura 6.62


se muestra la respuesta en el tiempo, del sistema en lazo cerrado correspon-
diente, cuando el valor deseado de posicion es un escalon unitario. Se puede
observar que el tiempo de subida es de 0.0612[s] y que el sobre paso es del
30 %. Aunque estos valores no son exactamente iguales a los especificados al
principio (tr = 0.0628[s] y Mp = 20 %), sin embargo son relativamente cerca-
nos. Esta diferencia se atribuye al hecho de que el cero que posee la funcion
de transferencia de lazo cerrado, y que es introducido por el controlador PD,
modifica un tanto la forma de la respuesta transitoria de una manera que no
se ha cuantificado de manera exacta. Si se desea cumplir exactamente con las
especificaciones de respuesta en el tiempo que se han indicado al principio,
se puede proceder a hacer un rediseno. Es decir, proponga un margen de fase
un poco mayor para reducir el sobre paso. Si al conseguir el sobre paso de-
seado el sistema sigue siendo mas rapido que lo deseado, entonces proponga
una frecuencia de cruce de ganancia un poco menor para obtener un tiempo
de subida un poco mas grande. Sin embargo, en lugar de hacer esto, en la
siguiente seccion se buscara cumplir con otra especificacion para el tiempo de
subida.
6.8 Ejemplos 363

Bode Diagram

60

50

Magnitude (dB) 40

30

20
System: ghcomp
10 Frequency (rad/sec): 25.9
Magnitude (dB): 0.0325
0

10

20
90
Phase (deg)

120

System: ghcomp
Frequency (rad/sec): 25.8
Phase (deg): 132
150
0 1 2
10 10 10
Frequency (rad/sec)

Figura 6.61. Graficas de Bode de la funcion de transferencia en (6.50), cuando


kd = 0.0255, kp = 0.7499, k = 675.4471 y a = 2.8681.

6.8.4. Rediseno del control PD de posicion de un motor de CD

Considere de nuevo el control PD de posicion de un motor de CD. Es


decir, el diagrama de bloques del sistema de control en lazo cerrado es el que
se muestra en la figura 6.57 y la funcion de transferencia de lazo abierto es
la que se muestra en (6.50), expresion que se reescribe a continuacion para
facilitar la referencia:
k kp
G(s)H(s) = kd (s + b) , b= (6.56)
s(s + a) kd

En la seccion 6.8.3 se mostro que cuando los valores numericos del motor son:

k = 675.4471, a = 2.8681
k
y se usa solo el factor s(s+a) entonces la frecuencia de cruce de ganancia es
1 = 25.9[rad/s]. Ademas, en lazo cerrado se obtiene un tiempo de subida de
tr = 0.0628[s] y un sobre paso de Mp = 83 % cuando se usa un controlador
proporcional de ganancia kp = 1. A continuacion se disenara un controlador
364 6 Diseno usando la respuesta en frecuencia

1.4

[rad] System: Mc
1.2 Time (sec): 0.116
Amplitude: 1.3

1
System: Mc
Time (sec): 0.0612
Amplitude: 1

0.8

0.6

0.4

0.2

0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7

tiempo [s]

Figura 6.62. Respuesta en el tiempo del sistema en lazo cerrado mostrado en la


figura 6.57, cuando kd = 0.0255, kp = 0.7499, k = 675.4471 y a = 2.8681.

proporcional-derivativo para conseguir la mitad del tiempo de subida y un


sobre paso del 20 %, es decir ahora se desea:
0.0628
tr = = 0.0314[s], Mp = 20 % (6.57)
2
Como ya se ha mencionado, para reducir el tiempo de subida (aumentar la
rapidez de respuesta en el tiempo), se debe aumentar la frecuencia de cruce
de ganancia 1 . Sin embargo, no se ha definido una expresion matematica
que relacione al tiempo de subida con la frecuencia de cruce de ganancia. A
continuacion se explicara como puede seleccionar 1 a fin de obtener un valor
especificado de tr .
Primero, considere el sistema en lazo cerrado de la figura 6.63. La funcion
de transferencia de lazo abierto es:
kp k
G(s) = (6.58)
s(s + a)
mientras que la funcion de transferencia de lazo cerrado es:
(s) G(s) n2
= = 2 , n2 = kp k, 2n = a (6.59)
d (s) 1 + G(s) s + 2n s + n2
6.8 Ejemplos 365

d ( s) + I (s) k
(s)
kp s ( s+a)

Figura 6.63. Control proporcional de posicion.

Las graficas de Bode de (6.58) tienen la forma presentada en la figura 6.64,


mientras que las graficas de Bode de (6.59) tienen la forma presentada en la
figura 6.14(b). De acuerdo a esta ultima figura, la funcion de transferencia
en (6.59) tiene magnitud unitaria cuando 0. Esto puede entenderse a
G(s)
partir de la expresion 1+G(s) y la figura 6.64, observando que |G(j)| +
cuando
0. Esto significa que la funcion de transferencia de lazo cerrado
G(j)
1+G(j) 1 cuando 0.

dB
i)
a !
0
1 ii)
iii)
iv)

fase
[grados] a !
0
iii)
90 ii)
180 iv)
kp k
Figura 6.64. Graficas de Bode de G(s) presentada en (6.58). i) a
, ii) 1s , iii) s+a
a
,
kp k
iv) s(s+a) .

Por otro lado, de acuerdo a la figura 6.14(b), la funcion de transferencia en


(6.59) tiene magnitud que tiende a cero cuando +. De nuevo, esto pue-
G(s)
de entenderse a partir de la expresion 1+G(s) y la figura 6.64, observando que
|G(j)| 0 cuando
+. Esto significa que la funcion de transferencia
G(j)
de lazo cerrado 1+G(j) 0 cuando +.
De acuerdo a estas ideas, la frecuencia de esquina que la funcion de trans-
ferencia en (6.59) presenta en = n (vease la figura 6.14(b)) debe ocurrir
366 6 Diseno usando la respuesta en frecuencia

aproximadamente cuando se alcanza la frecuencia de cruce


de ganancia en la
G(j)
figura 6.64 (cuando |G(j)| 1 y, por tanto, 1+G(j) empieza a decrecer de
manera importante). Esta observacion permite concluir que n en la figura
6.14(b) crece si 1 , medida en la figura 6.64, tambien crece.
Por otro lado, de acuerdo a:
" p !#
1 1 2 p
tr = p arctan , d = n 1 2 ,
n 1 2

si se desea reducir el tiempo de subida a la mitad (despreciando el efecto


debido a la variacion del amortiguamiento ) entonces debe aumentarse n al
doble. Esto significa, de acuerdo a la discusion anterior, que la frecuencia de
cruce de ganancia 1 debe aumentarse al doble.
Entonces, si tr = 0.0628[s] cuando 1 = 25.9[rad/s], debe usarse:

1 = 51.8[rad/s] (6.60)

para conseguir el tiempo de subida tr = 0.0314[s]. Por otro lado, en la seccion


6.8.3 se encontro que para obtener un sobre paso del 20 % se debe buscar un
margen de fase de:

Kf = +47.5 (6.61)
k
En la figura 6.65 se muestran las graficas de Bode de s(s+a) cuando k =
675.4471 y a = 2.8681. Se observa que la magnitud y la fase valen 12[dB]
y 177 cuando = 51.8[rad/s]. Esto corresponde a un margen de fase de
+3 . Como el margen de fase deseado es de +47.5 entonces se necesita que
el controlador introduzca una fase positiva de 47.5 3 = 44.5 cuando =
51.8[rad/s]. Recuerdese que, de acuerdo a (6.52), la funcion de transferencia
de lazo abierto del sistema compensado esta dada como:
k
G(s)H(s) = kd b(z + 1)
s(s + a)
k
donde kd b(z + 1) = kd s + kp , con b = kpd y z = 1b s, es el controlador PD. En la
figura 6.66 se muestran las graficas de Bode del factor z + 1. Recuerdese que
en estas graficas el eje horizontal corresponde a 1b (vease la seccion 6.4.1). El
adelanto de fase requerido de +44.5 ocurre cuando 1b = 0.982. Como este
adelanto de fase debe ocurrir cuando la frecuencia sea igual a la frecuencia de
cruce de ganancia deseada = 51.8[rad/s] entonces:

b= = 52.8033
0.982 =51.8
Por otro lado, se desea que la frecuencia de cruce de ganancia sea =
51.8[rad/s]. Esto requiere que el controlador introduzca, a esta frecuencia,
6.8 Ejemplos 367

Bode Diagram

60

50

40

30
Magnitude (dB)

20

10
System: gh
0 Frequency (rad/sec): 51.8
Magnitude (dB): 12
10

20

30

40
90

120
Phase (deg)

150
System: gh
Frequency (rad/sec): 51.7
Phase (deg): 177

180
0 1 2
10 10 10
Frequency (rad/sec)

k
Figura 6.65. Graficas de Bode de s(s+a)
cuando k = 675.4471 y a = 2.8681.

la misma magnitud, pero de signo contrario, que la magnitud introducida


k
(12[dB]) por el factor s(s+a) en esta frecuencia (para que la magnitud del
sistema compensado sea de 0[dB] a la nueva frecuencia de cruce de ganancia).
Esto implica que se debe exigir lo siguiente:

|kd b(z + 1)|dB = 20 log(kd b) + |z + 1|dB = 12[dB] (6.62)

donde, de acuerdo a la figura 6.66, se debe usar |z + 1|dB = 2.95[dB]. Por


tanto, despejando kd y realizando los calculos correspondientes se encuentra:
1 122.95
kd = 10 20 = 0.0537
b
kp
Finalmente, usando b = kd se obtiene:

kp = bkd = 2.8347

En la figura 6.67 se muestran las graficas de Bode de la funcion de transferencia


de lazo abierto del sistema compensado (mostrada en (6.56)). En esta figura
se puede verificar que la frecuencia de cruce de ganancia es = 51.8[rad/s]
368 6 Diseno usando la respuesta en frecuencia

Bode Diagram

25

20
Magnitude (dB)

15

10

System: gc
Frequency (rad/sec): 0.983
5 Magnitude (dB): 2.95

0
90
Phase (deg)

45
System: gc
Frequency (rad/sec): 0.982
Phase (deg): 44.5

0
1 0 1
10 10 10
Frequency (rad/sec)

Figura 6.66. Graficas de Bode del factor z + 1.

y que la fase a esa frecuencia es 132 , lo cual corresponde a un margen


de fase de +48 . Esto significa que se han conseguido las especificaciones de
respuesta en frecuencia establecidas en (6.60) y (6.61). Por otro lado, en la
figura 6.68 se muestra la respuesta en el tiempo, del sistema en lazo cerrado
correspondiente, cuando el valor deseado de posicion es un escalon unitario.
Se puede observar que el tiempo de subida es de 0.03[s] y que el sobre paso es
del 31 %. Aunque estos valores no son exactamente iguales a los especificados
al principio (tr = 0.0314[s] y Mp = 20 %), sin embargo son relativamente
cercanos. La razon de esta diferencia y la manera de corregirla ya ha sido
explicada en la seccion 6.8.3 por lo que se sugiere consultar dicha parte de la
presente obra.

6.8.5. Control PID de posicion de un motor de CD

Considere el modelo de un motor de CD presentado en (5.12), captulo 5,


el cual se reescribe a continuacion para facilitar la referencia:
k
(s) = I (s) (6.63)
s(s + a)
6.8 Ejemplos 369

Bode Diagram

30

25

Magnitude (dB) 20

15

10
System: ghcomp
5 Frequency (rad/sec): 51.9
Magnitude (dB): 0.0529
0

10
90

120
Phase (deg)

System: ghcomp
Frequency (rad/sec): 51.8
150 Phase (deg): 132

180
1 2
10 10
Frequency (rad/sec)

Figura 6.67. Graficas de Bode de la funcion de transferencia en (6.56), cuando


kd = 0.0537, kp = 2.8347, k = 675.4471 y a = 2.8681.

b nkm
a= > 0, k= >0
J J
donde (s) e I (s) representan la posicion (salida) y la consigna de corriente
(entrada), respectivamente. En esta parte se disenara el siguiente controlador
PID de posicion:
Z t
de
i = kp e + kd + ki e(r)dr, e = d
dt 0

donde d es la posicion deseada y las constantes kp , kd y ki se conocen como


las ganancias proporcional, derivativa e integral, respectivamente. Usando la
transformada de Laplace se obtiene:
E(s)
I (s) = kp E(s) + kd sE(s) + ki
s
ki
= kp + kd s + E(s)
s
kp ki
s2 + kd s + kd
= kd E(s)
s
370 6 Diseno usando la respuesta en frecuencia

System: Mc

1.4 Time (sec): 0.0579


Amplitude: 1.31

[rad]
1.2
System: Mc
Time (sec): 0.03
Amplitude: 1
1

0.8

0.6

0.4

0.2

0
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35

tiempo [s]

Figura 6.68. Respuesta en el tiempo del sistema en lazo cerrado mostrado en la


figura 6.57, cuando kd = 0.0537, kp = 2.8347, k = 675.4471 y a = 2.8681.

Entonces, el sistema en lazo cerrado se representa por el diagrama de bloques


mostrado en la figura 6.69. La funcion de transferencia de lazo abierto es:

d(s) + kp k
s 2+k s+k i
(s)
d d
k
kd s s(s+a)

Figura 6.69. Sistema en lazo cerrado del control PID de posicion de un motor de
CD.

kp ki
s2 + kd s + kd k
G(s)H(s) = kd (6.64)
s s(s + a)
Definiendo:
kp ki
s2 + s+ = (s + z1 )(s + z2 ) = s2 + (z1 + z2 )s + z1 z2
kd kd
6.8 Ejemplos 371

se concluye que:
kp ki
= z1 + z2 , = z1 z2 (6.65)
kd kd
En la figura 6.70 se muestra un bosquejo de la grafica polar de (6.64) cuando
se recorre la trayectoria de Nyquist modificada mostrada en la figura 6.56.
Notese que existen dos polos en s = 0 y se debe proceder de nuevo como en
la seccion 6.8.3 para rodear el origen en el plano s. Esta es la razon para el
crculo de radio infinito en la figura 6.70. Ademas, no es difcil darse cuenta
k
que, para 0 < < +, la grafica polar del factor s2 (s+a) es como la mostrada

en la figura 6.55, pero girada 90 en sentido horario (en sentido antihorario
para < < 0). Por tanto, el adelanto de fase debido al factor de segundo
k
orden s2 + kdp s + kkdi debe modificar la grafica polar como en la figura 6.70.
De este modo se obtiene estabilidad en lazo cerrado pues P = 0, N = 0 y
Z = N + P = 0. Para alcanzar este objetivo se propone usar el siguiente
criterio de diseno:

Im (G (j!) H (j!) )


+ 180 ! = 0 ! ! +1

180 ! = 0 + 1 ! ! 1 Re (G (j!) H (j!) )
r!1

Figura 6.70. Grafica polar de (6.64) cuando se recorre la trayectoria de Nyquist


modificada mostrada en la figura 6.56.

z1 = a (6.66)

porque esto simplifica a la funcion de transferencia de lazo abierto, presentada


en (6.64), del siguiente modo:
k
G(s)H(s) = kd (s + z2 ) (6.67)
s2
372 6 Diseno usando la respuesta en frecuencia

Se debe subrayar que la cancelacion de los factores s + z1 y s + a es valida


porque ambos corresponden a polos y ceros con parte real negativa pues a > 0
y z1 > 0. Realizando algunos pasos algebraicos adicionales en (6.67) se obtiene:

s + z2 k 1 k k
G(s)H(s) = kd z2 = kd z2 s + 1 2 = kd z2 (z + 1) 2 (6.68)
z2 s2 z2 s s

donde se ha definido z = z12 s. Ahora el factor sk2 representa el sistema sin


compensar y sus graficas de Bode se presentan en la figura 6.71 cuando se
usan los valores numericos del motor de CD controlado experimentalmente en
el captulo 10, es decir:

k = 675.4471

Bode Diagram

60

50

40

30
Magnitude (dB)

20

10
System: gh
0 Frequency (rad/sec): 51.9
Magnitude (dB): 12
10

20

30

40
179

179.5
Phase (deg)

180
System: gh
Frequency (rad/sec): 51.7
Phase (deg): 180
180.5

181
0 1 2
10 10 10
Frequency (rad/sec)

k
Figura 6.71. Graficas de Bode del factor s2
cuando k = 675.4471.

Se puede observar que la magnitud y la fase son iguales a 12[dB] y 180


cuando la frecuencia es igual a 51.8[rad/s]. De acuerdo a la seccion 6.8.4, se
propone usar la siguiente frecuencia de cruce de ganancia:

1 = 51.8[rad/s] (6.69)
6.8 Ejemplos 373

y el siguiente margen de fase:


Kf = +47.5 (6.70)
para conseguir el tiempo de subida tr = 0.0314[s] y un sobre paso de 20 %.
Por tanto, el controlador definido por kd z2 (z + 1) debe introducir un adelanto
de fase de +47.5 y una magnitud de +12[dB] cuando la frecuencia sea igual
a 51.8[rad/s]. En la figura 6.72 se observa que el factor z + 1 introduce una
fase de +47.4 cuando z12 = 1.09 (vease la seccion 6.4.1). Como esto debe
ocurrir cuando = 51.8[rad/s], entonces:

z2 = = 47.5229
1.09 =51.8
Por otro lado, se desea que la frecuencia de cruce de ganancia sea =

Bode Diagram

25

20
Magnitude (dB)

15

10
System: gc
Frequency (rad/sec): 1.09
5 Magnitude (dB): 3.4

0
90
Phase (deg)

45
System: gc
Frequency (rad/sec): 1.09
Phase (deg): 47.4

0
1 0 1
10 10 10
Frequency (rad/sec)

Figura 6.72. Graficas de Bode del factor z + 1.

51.8[rad/s]. Esto requiere que el controlador introduzca, a esta frecuencia,


la misma magnitud, pero de signo contrario, que la magnitud introducida
(12[dB]) por el factor sk2 en esta frecuencia (para que la magnitud del sistema
compensado sea de 0[dB] a la nueva frecuencia de cruce de ganancia). Esto
implica que se debe exigir lo siguiente:
374 6 Diseno usando la respuesta en frecuencia

|kd z2 (z + 1)|dB = 20 log(kd z2 ) + |z + 1|dB = 12[dB] (6.71)

donde, de acuerdo a la figura 6.72, se debe usar |z +1|dB = 3.4[dB]. Por tanto,
despejando kd y realizando los calculos correspondientes se encuentra:
1 123.4
kd = 10 20 = 0.0566
z2

Finalmente, usando (6.65), (6.66) y a = 2.8681 (vease el captulo 10) se ob-


tiene:

kp = kd (z1 + z2 ) = 2.8540, ki = kd z1 z2 = 7.7196

En la figura 6.73 se muestran las graficas de Bode de la funcion de transferencia


de lazo abierto, del sistema compensado, mostrada en (6.64). En esta figura
se puede verificar que la frecuencia de cruce de ganancia es = 51.8[rad/s]
y que la fase a esa frecuencia es 133 , lo cual corresponde a un margen
de fase de +47 . Esto significa que se han conseguido las especificaciones de
respuesta en frecuencia establecidas en (6.69) y (6.70). Por otro lado, en la
figura 6.74 se muestra la respuesta en el tiempo, del sistema en lazo cerrado
correspondiente, cuando el valor deseado de posicion es un escalon unitario. Se
puede observar que el tiempo de subida es de 0.0291[s] y que el sobre paso es
del 33 %. Aunque estos valores no son exactamente iguales a los especificados
al principio (tr = 0.0314[s] y Mp = 20 %), sin embargo son relativamente
cercanos. La razon de esta diferencia y la manera de corregirla ya ha sido
explicada en la seccion 6.8.3 por lo que se sugiere consultar dicha parte de la
presente obra.
6.8 Ejemplos 375

Bode Diagram

30

25

20

Magnitude (dB)
15

10
System: ghcomp
5 Frequency (rad/sec): 51.8
Magnitude (dB): 0.0218
0

10
90

120
Phase (deg)

System: ghcomp
Frequency (rad/sec): 51.7
150 Phase (deg): 133

180
1 2
10 10
Frequency (rad/sec)

Figura 6.73. Graficas de Bode de la funcion de transferencia en (6.64), cuando


kd = 0.0566, kp = 2.8540, ki = 7.7196 k = 675.4471 y a = 2.8681.

1.4

[rad] System: Mc
Time (sec): 0.0577
1.2 Amplitude: 1.33

1
System: Mc
Time (sec): 0.0291
Amplitude: 1

0.8

0.6

0.4

0.2

0
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35

tiempo [s]

Figura 6.74. Respuesta en el tiempo del sistema en lazo cerrado mostrado en la


figura 6.69, cuando kd = 0.0566, kp = 2.8540, ki = 7.7196 k = 675.4471 y a = 2.8681.
376 6 Diseno usando la respuesta en frecuencia

6.9. Caso de estudio. Control PID de un sistema de


levitacion magnetica
Considere el modelo de un sistema de levitacion magnetica presentado
en (11.31), captulo 11, el cual se reescribe a continuacion para facilitar la
referencia:
11613700
G(s) =
s3 + 2739s2 1250s 3.536 106
El polinomio caracterstico de esta funcion de transferencia se puede factorizar
del siguiente modo s3 + 2739s2 1250s 3.536 106 = (s + 35.9)(s 35.9)(s +
2739). As que este sistema es inestable en lazo abierto debido a que tiene un
polo con parte real positiva ubicado en s = 35.9. Para resolver este problema
se usara el siguiente controlador PID (vease la seccion 6.8.5):
kp ki
s2 + kd s + kd
kd = kd (s + z1 )(s + z2 ) = kd (s2 + (z1 + z2 )s + z1 z2 )
s
kp ki
= z1 + z2 , = z1 z2 (6.72)
kd kd
Entonces la funcion de transferencia de lazo abierto es:
(s + z1 )(s + z2 ) k
G(s)H(s) = kd (6.73)
s s3 + 2739s2 1250s 3.536 106
(s + z1 )(s + z2 ) k
= kd , k = 11613700
s (s + 35.9)(s 35.9)(s + 2739)
De esta manera, el sistema es de tipo 1 y, ante una referencia constante, el
error en estado estacionario sera igual a cero si el sistema en lazo cerrado
es estable. El controlador PID debera ser disenado para asegurar que esta
condicion se cumple. Para esto se considerara el siguiente criterio de diseno:

z1 = 35.9 (6.74)

De este modo se obtiene:


k
G(s)H(s) = kd (s + z2 )
s(s 35.9)(s + 2739)
o bien:
k
G(s)H(s) = kd z2 (z + 1) (6.75)
s(s 35.9)(s + 2739)

donde se ha definido z = z12 s. Se debe subrayar que la cancelacion de los


factores s + z1 y s + 35.9 es valida porque ambos corresponden a polos y ceros
con parte real negativa pues 35.9 > 0 y z1 > 0. En la figura 6.75 se muestra
un bosquejo de las graficas de Bode de la funcion de transferencia:
6.9 Caso de estudio 377

dB
i)
35:9 2739 !
0 1
iii) iv)
ii)

v)

fase
[grados]

0 35:9 2739 !
iv)
90 ii)
iii)
180

v)
270

k
Figura 6.75. Graficas de Bode de (6.76). i) (35.9)(2739) , ii) 1s , iii) s35.9
35.9 2739
, iv) s+2739 ,
k
v) s(s35.9)(s+2739) .

k
G0 (s) = (6.76)
s(s 35.9)(s + 2739)

donde se ha hecho uso de los resultados obtenidos en la seccion 6.8.1 para


a
obtener las graficas de Bode de un factor de la forma sa con a > 0. Usando
la figura 6.75 se procede a dibujar la grafica polar mostrada en la figura 6.76.
Es importante subrayar que la funcion de transferencia en (6.76) tiene un
polo en el origen por lo que se debe usar la trayectoria de Nyquist modificada
mostrada en la figura 6.56. De acuerdo a esto, se debe dar un rodeo alrededor
de s = 0 del siguimiente modo. En (6.76) se debe hacer el cambio de variable
s = :
k k
G0 () = =
( 35.9)( + 2739) (35.9)(2739)
k k
= = ( 180o )
(35.9)(2739) (35.9)(2739)
378 6 Diseno usando la respuesta en frecuencia

recordando que 0. Esto justifica el semicrculo de radio infinito que

Im ( G 0 (j!))

! = 0+ 270 o

1 !! +1

!! 1 Re ( G 0 (j!))

r!1
90 o
! = 0

Figura 6.76. Grafica polar de (6.76) cuando se recorre la trayectoria de Nyquist


modificada mostrada en la figura 6.56.

pasa de 90 cuando = 0 a 270 cuando = 0+ (vease la figura 6.56).


En la figura 6.76 es claro que N = 1 y como P = 1 (vease (6.76) entonces
Z = N +P = 2, por lo que habra inestabilidad en lazo cerrado. Por esta razon,
para conseguir estabilidad en lazo cerrado usando la funcion de transferencia
de lazo abierto (6.75) (con un controlador PID), el factor kd z2 (z + 1) debe
introducir un adelanto de fase suficiente como para que se obtenga una grafica
polar como se muestra en la figura 6.77. De este modo N = 1 y como P = 1
entonces Z = N + P = 0 y el sistema en lazo cerrado sera estable. En la
figura 6.78 se muestran las graficas de bode de (6.76). Se puede observar que
la magnitud y la fase son iguales a 0[dB] y 212 cuando la frecuencia es igual
a 60[rad/s]. Se propone mantener la misma frecuencia de cruce de ganancia:

1 = 60[rad/s] (6.77)

y conseguir el siguiente margen de fase3 :

Kf = +20 (6.78)
3
Aunque el margen de fase fue presentado en la seccion 6.6 para sistemas de fase
mnima, este concepto es aplicable de manera directa en este ejemplo
6.9 Caso de estudio 379

Im(G(j!)H(j!))
! = 0+ 270 o

1 !! 1

!! +1
Re(G(j!)H(j!))

r!1
! = 0 90 o

Figura 6.77. Grafica polar de (6.75) cuando se recorre la trayectoria de Nyquist


modificada mostrada en la figura 6.56.

Bode Diagram

50

0
System: gh
Frequency (rad/sec): 60
Magnitude (dB)

Magnitude (dB): 0.0673


50

100

150

200
180
Phase (deg)

System: gh
225 Frequency (rad/sec): 60.1
Phase (deg): 212

270
0 1 2 3 4 5
10 10 10 10 10 10
Frequency (rad/sec)

Figura 6.78. Graficas de Bode de (6.76).

Ya que la planta a controlar es naturalmente inestable, la idea es simplemente


asegurar estabilidad en lazo cerrado sin preocuparse por ninguna otra espe-
cificacion como podran ser el tiempo de subida y el sobrepaso. Por tanto,
380 6 Diseno usando la respuesta en frecuencia

el controlador definido por kd z2 (z + 1) debe introducir un adelanto de fase


de +52 y una magnitud de 0[dB] cuando la frecuencia sea igual a 60[rad/s].
En la figura 6.79 se observa que el factor z + 1 introduce una fase de +52
cuando z12 = 1.28 (vease la seccion 6.4.1). Como esto debe ocurrir cuando
= 60[rad/s], entonces:

z2 = = 46.875
1.28 =60
Por otro lado, se desea que la frecuencia de cruce de ganancia sea =

Bode Diagram

40

35

30
Magnitude (dB)

25

20

15
System: Adel
10 Frequency (rad/sec): 1.28
Magnitude (dB): 4.24
5

0
90
Phase (deg)

45 System: Adel
Frequency (rad/sec): 1.28
Phase (deg): 52

0
2 1 0 1 2
10 10 10 10 10
Frequency (rad/sec)

Figura 6.79. Graficas de Bode del factor z + 1.

60[rad/s]. Esto requiere que el controlador introduzca, a esta frecuencia, una


magnitud de 0[dB] para que la magnitud del sistema compensado sea de 0[dB]
a la frecuencia de cruce de ganancia. Esto implica que se debe exigir lo siguien-
te:

|kd z2 (z + 1)|dB = 20 log(kd z2 ) + |z + 1|dB = 0[dB] (6.79)

donde, de acuerdo a la figura 6.79, se debe usar |z + 1|dB = 4.24[dB]. Por


tanto, despejando kd y realizando los calculos correspondientes se encuentra:
1 4.24
kd = 10 20 = 0.0131
z2
Finalmente, usando (6.72) y (6.74) se obtiene:
6.9 Caso de estudio 381

kp = kd (z1 + z2 ) = 1.0838, ki = kd z1 z2 = 22.0341

En la figura 6.80 se muestran las graficas de Bode de la funcion de transferencia


de lazo abierto del sistema compensado (dada en (6.73), es decir, G(s)H(s) =
kp + kd s + ksi s3 +2739s2 1250s3.53610
k
6 ). En esta figura se puede verificar

que la frecuencia de cruce de ganancia es = 60[rad/s] y que la fase a esa


frecuencia es 160 , lo cual corresponde a un margen de fase de +20 . Esto
significa que se han conseguido las especificaciones de respuesta en frecuencia
establecidas en (6.77) y (6.78). Finalmente, en la figura 6.81 se muestra la
respuesta en el tiempo, ante un escalon unitario, cuando se cierra el lazo
alrededor de G(s)H(s) = kp + kd s + ksi s3 +2739s2 1250s3.53610
k
6 . Se puede

observar que el tiempo de subida es de 0.0166[s] y que el sobre paso es del 89 %.


Como se dijo anteriormente, no se ha procurado hacer nada por conseguir
un tiempo de subida y un sobre paso especficos y solo se busca asegurar
la estabilidad en lazo cerrado. Por esta razon, la respuesta en el tiempo de
la figura 6.81 se considera satisfactoria. Se deja como ejercicio al lector el
conseguir un diseno con el cual se consiga una respuesta mas amortiguada.
Para esto, debe especificar un margen de fase mayor.

Bode Diagram

50

System: gh
Frequency (rad/sec): 60
Magnitude (dB): 0.0784
0
Magnitude (dB)

50

100
90

135
Phase (deg)

System: gh
180
Frequency (rad/sec): 60
Phase (deg): 160

225

270
0 1 2 3 4 5
10 10 10 10 10 10
Frequency (rad/sec)

Figura 6.80. Graficas


de Bode de la funcion de transferencia en (6.73), es de-
cir, G(s)H(s) = kp + kd s + ksi s3 +2739s2 1250s3.53610
k
6 con kd = 0.0131, kp =

1.0838, ki = 22.0341.
382 6 Diseno usando la respuesta en frecuencia

Step Response

1.8 System: M
Time (sec): 0.0449
Amplitude: 1.89

1.6

1.4

1.2 System: M
Amplitude

Time (sec): 0.0166


Amplitude: 1
1

0.8

0.6

0.4

0.2

0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7
Time (sec)

Figura 6.81. Respuesta en el tiempo,


ante unescalon unitario, cuando se cierra el
lazo alrededor de G(s)H(s) = kp + kd s + ksi s3 +2739s2 1250s3.53610
k
6 con kd =

0.0131, kp = 1.0838, ki = 22.0341.

6.10. Resumen del captulo

Un resultado fundamental del estudio de las ecuaciones diferenciales li-


neales es el siguiente. Dada una ecuacion diferencial lineal totalmente arbi-
traria, si se aplica a la entrada una funcion sinusoidal del tiempo entonces la
respuesta forzada a la salida es otra funcion sinusoidal del tiempo. Estas fun-
ciones sinusoidales difieren en sus amplitudes y sus fases pero son de la misma
frecuencia. Las relaciones entre las amplitudes y las fases de estas funciones
dependen de su frecuencia y la forma en que varan se conoce como respuesta
en frecuencia.
La propiedad fundamental de la respuesta en frecuencia que la teora de
control explota es el hecho de que la manera en que varan las relaciones entre
amplitudes y fases de las funciones a la entrada y a la salida depende de la ubi-
cacion de los polos y los ceros de la funcion de transferencia correspondiente.
En sistemas de lazo abierto, esto permite interpretar a las ecuaciones diferen-
ciales lineales, y a los sistemas de control lineales, como filtros. Esto significa
que la rapidez y las oscilaciones presentes en la respuesta de un sistema de
control dependen del contenido de componentes de frecuencia de la entrada
y de que componentes de frecuencia deja pasar el sistema de control: i) las
componentes de frecuencia altas favorecen una respuesta rapida, ii) si una
banda de frecuencias es favorecida (pico de resonancia) entonces la respuesta
6.11 Preguntas de repaso 383

es oscilatoria, iii) del tratamiento que se de a las componentes de frecuencias


bajas (cero) depende el valor de la salida en estado estacionario, iv) el efecto
del ruido se reduce si las componentes de muy alta frecuencia son fuertemente
atenuadas.
Un logro importante del estudio de los sistemas de control bajo el en-
foque de la respuesta en frecuencia es el poder relacionar las caractersticas
de respuesta en frecuencia en lazo abierto (frecuencia de cruce de ganancia
y margenes de estabilidad) con las caractersticas de respuesta en el tiempo
(rapidez y oscilaciones de la respuesta) del sistema de control en lazo cerrado.
De esta manera se puede disenar un controlador buscando que este modifique
convenientemente las graficas de respuesta en frecuencia del sistema en lazo
abierto.

6.11. Preguntas de repaso

1. Que entiende por respuesta en frecuencia? Que representan la magnitud


y la fase de una funcion de transferencia?
2. Las funciones de transferencia estan constituidas por polos y ceros Cuales
de estos componentes contribuyen como filtros pasa altas y cuales como
filtros pasa bajas? Cuales de ellos introducen fase positiva y cuales fase
negativa?
3. Dado un sistema de control en lazo cerrado Por que los ceros contribuyen
a la estabilidad cuando son colocados en la funcion de transferencia de lazo
abierto? Como contribuyen los polos de lazo abierto a la estabilidad?
Cual es la ventaja de agregar polos en la funcion de transferencia de lazo
abierto?
4. Cual es la relacion del criterio de estabilidad de Nyquist con los margenes
de estabilidad?
5. Dado un sistema en lazo abierto Por que una frecuencia de corte (o
de esquina) mayor contribuye a una mayor rapidez de la respuesta en el
tiempo?
6. Que se debe hacer con la frecuencia de cruce de ganancia para conse-
guir que el sistema en lazo cerrado tenga una respuesta mas rapida en el
tiempo?
7. Como afecta el margen de fase a la respuesta en el tiempo del sistema
en lazo cerrado?
8. Cual es la modificacion que se debe hacer al criterio de estabilidad de
Nyquist para que pueda ser aplicado a funciones de transferencia de lazo
abierto con polos y/o ceros sobre el eje imaginario? Cual es la razon para
esto?
9. Que es un sistema de fase mnima?
10. Que es la trayectoria de Nyquist y que es la trayectoria de Nyquist mo-
dificada?
384 6 Diseno usando la respuesta en frecuencia

6.12. Ejercicios propuestos


1. Como obtiene el error en estado estacionario de un sistema en lazo cerra-
do ante referencias tipo escalon, rampa y parabola, a partir de las graficas
de Bode? Investigue.
2. Considere un sistema integrador:
Z t
y(t) = k u dt
0

y un sistema derivador:

y(t) = k u(t)

a)
En ambos casos suponga que u = A cos(t), con A una constante,
y calcule y(t). Haga una grafica donde muestre como vara la ampli-
tud de y(t) respecto de la frecuencia en cada caso y compare con las
graficas de Bode mostradas en las figuras 6.13(a) y 6.13(b).
b) Cual es el efecto de un derivador cuando u tiene alto contenido de
ruido? (sinusoide de alta frecuencia). En base a lo anterior responda
que piensa que sucedera en los siguientes casos: Que efecto tiene
un controlador que contiene alguna accion derivativa en un sistema
de control de posicion que tiene alto contenido de ruido? Cual es
el efecto del ruido en un sistema de control que contiene una accion
integral unicamente?
c) Considere el caso de un piston neumatico. El flujo de aire de entrada
es u y la posicion del embolo del piston es y. Suponga que el aire no
se comprime ni se expande (que es incompresible) dentro del piston y
que el embolo del piston no tiene masa. Si se extrae flujo de aire del
piston entonces u < 0, si se introduce flujo de aire al piston entonces
u > 0. Bajo estas condiciones este sistema se comporta como un inte-
grador. Suponga que se aplica una entrada de la forma u = A cos(t)
con un valor de que cada vez se acerca mas a cero. Usando su ex-
periencia cotidiana explique que sucede con la posicion del piston y
compare con lo que indican las graficas de Bode correspondientes a
este problema y las graficas obtenidas en el primer inciso de este ejer-
cicio. Que significa el termino ganancia infinita a frecuencia cero?
Aunque un motor de CD con escobillas no es exactamente un integra-
dor, use su experiencia cotidiana para ver si tiene un comportamiento
similar al descrito cuando y es la posicion y u = A cos(t) el voltaje
aplicado. Desde el punto de vista del modelo del motor Como puede
explicar este comportamiento?
3. Considere el siguiente sistema:
a
Y (s) = U (s), a>0
s+a
6.12 Ejercicios propuestos 385

Suponga que u(t) es una onda cuadrada (de perodo igual a 2) que es
igual a la unidad durante el primer medio perodo e igual a cero durante el
segundo medio perodo. Utilice algun software especializado para realizar
varias simulaciones utilizando diferentes valores de a desde valores muy
cercanos a cero hasta valores considerablemente grandes. Observe la forma
de y(t) en estas simulaciones. Por que cree que y(t) sea muy diferente
de u(t) cuando a es muy cercana a cero? Por que cree que y(t) sea cada
vez mas parecida a u(t) cuando a es considerablemente grande? Puede
explicar este comportamiento desde el punto de vista de conceptos basados
a
en la respuesta en frecuencia de la funcion de transferencia s+a ?
4. Existe un resultado fundamental en la teora de sistemas lineales que afir-
ma que si Y (s) = G(s)U (s) con u(t) una funcion periodica y si todos
los polos de G(s) tienen parte real estrictamente negativa, entonces y(t)
converge a una funcion periodica con el mismo perodo de u(t) pero posi-
blemente no con la misma forma de onda [5], pag. 389 (vease tambien el
ejercicio 13 del captulo 3) El ejemplo planteado en el ejercicio 3 de este
captulo le sugiere alguna explicacion acerca de porque u(t) y y(t) puedan
no tener la misma forma de onda? De que depende el que las formas de
onda de u(t) y y(t) sean parecidas o muy diferentes?
5. Considere la siguiente ecuacion diferencial:

y + n2 y = n2 u

El problema de calcular y(t) cuando t y u(t) = A sin(t) se simplifica


enormemente usando las graficas de Bode de la figura 6.14(b). Usando esta
informacion elabore graficas donde se aprecie como cambia y(t) cuando
t conforme cambia desde un valor = 1 < n hasta otro valor
= 2 > n .
A partir de lo anterior explique que sucede cuando se hace el mismo ex-
perimento pero ahora se tiene una ecuacion diferencial como la siguiente:

y + 2n y + n2 y = n2 u

con n > 0 y > 0. Que sucede conforme crece? Por que la resonancia
se considera peligrosa en muchas aplicaciones?
6. Considere un sistema en lazo cerrado como el de la figura 4.10 y la corres-
1
pondiente expresion para el error dada como E(s) = 1+G(s) R(s) donde
E(s) = R(s) C(s). Si el valor deseado es una sinusoide r(t) = A sin(t)
Que debe hacer para que el error lmt e(t) sea cada vez menor? Es po-
sible que se pueda tener que lmt e(t) = 0? Si la respuesta es afirmativa,
Bajo que condiciones? Verifique su respuesta mediante una simulacion.
7. Considere el circuito RLC paralelo mostrado en la figura 6.82. Demuestre
que la funcion de transferencia esta dada como:

V (s) kn2 s
= 2 (6.80)
I(s) s + 2n s + n2
386 6 Diseno usando la respuesta en frecuencia
q
1 1 L
donde n = LC , = 2R C , k = L. Dibuje las graficas de Bode corres-
pondientes cuando es cercana a cero (Como puede ser esto posible en la
practica?) y compruebe que se trata de un filtro pasa banda alrededor de
la frecuencia n (de hecho n conforme 0). Como puede
variar el valor de n en la practica?

I(s)
+

L R C V(s)

Figura 6.82. Circuito RLC paralelo.

Una aplicacion interesante e importante de este ejercicio es el radio-


receptor de AM mostrado en la figura 6.83 [6], pag. 94-99. Se sugiere
al lector que construya este receptor pues no es difcil hacerlo y a conti-
nuacion se detalla sobre la elaboracion de las partes mas importantes.
La inductancia se construye enrollando alambre magneto sobre un nucleo
cilndrico de carton o de plastico de aproximadamente 2.6[cm] de diametro
y aproximadamente 10[cm] de largo. Las espiras deben estar colocadas
una junto a la otra sin encimarse y sin dejar huecos apreciables entre
ellas. Entonces se utiliza papel lija para retirar completamente el barniz
que cubre al alambre de cobre sobre una franja a lo largo de todo el
cilindro de aproximadamente 0.5[cm] de ancho. Entonces, la inductancia
L se puede variar deslizando un contacto electrico a lo largo de esta franja
de alambre desnudo.
La antena consiste de un alambre de cobre de 30[m] de largo. Uno de los
extremos se fija, a traves de material aislante, a un punto solido sobre
una pared o un poste mientras que el otro extremo se conecta al circuito
sintonizador (LC en paralelo). Es importante que la antena no tenga con-
tacto electrico con ningun punto que no sea el indicado en la figura 6.83.
Notese que la funcion de la antena es recoger la senales electricas que son
transportadas por las ondas electromagneticas que emiten las estaciones
radiodifusoras comerciales de AM. Mientras mas larga sea la antena mas
intensas seran las senales recuperadas.
La conexion a tierra se realiza conectando firmemente dicho punto a una
tubera de agua de cobre. Es importante que la tubera sea de cobre y que
llegue a una profundidad suficiente dentro del suelo.
6.12 Ejercicios propuestos 387

El diodo 1N34A es de germanio y tiene la funcion de elemento detector,


es decir, es quien extrae la informacion que porta la onda electromagneti-
ca transmitida. Es importante que este diodo sea de germanio pues tiene
una barrera de potencial mucho menor que la de un diodo de silicio. Esto
facilita que la debil senal captada por la antena pueda vencer dicha barre-
ra de potencial. Precisamente debido a lo debil de esta senal tambien es
importante que todo el circuito de audio represente una alta impedan-
cia. Entonces el circuito basado en amplificador operacional debe tener
una ganancia elevada y su resistencia de entrada debe ser grande (aun-
que se sugiere de 100K[Ohm] pueden utilizarse otros valores para ajustar
convenientemente la ganancia de este amplificador).
El lector puede sintonizar diferentes estaciones simplemente variando la
inductancia L. Si la antena es suficientemente larga, si ademas se tiene una
buena conexion a tierra y si los audfonos son de alta impedancia entonces
se podran escuchar estaciones de radio incluso sin necesidad de bateras, es
decir, se puede sustituir todo el circuito contenido por las lneas punteadas
por un simple corto. En caso de usar el amplificador operacional se sugiere
usar dos bateras de 9[V] para proveer la alimentacion necesaria.
Puede explicar el funcionamiento del circuito de sintona de este receptor
a partir de la respuesta en frecuencia de la funcion de transferencia en
(6.80)? Por que solo aparecen los elementos L y C pero no R en la figura
6.83? Que variables en el radio receptor juegan los papeles de V (s) y I(s)
en (6.80)?

Antena
1M

1N34A 100K

+
NA741

L C Audifonos

Tierra

Figura 6.83. Radio-receptor de AM basico.

8. Considere el circuito RC mostrado en la figura 6.84. Si vi (t) es un escalon,


encuentre vo (t) y grafique estas dos senales. La senal vo (t) es continua o
388 6 Diseno usando la respuesta en frecuencia

discontinua en t = 0? Obtenga la funcion de transferencia VVoi (s)


(s)
, obtenga
las graficas de Bode correspondientes y diga si se trata de un filtro pasa
altas o pasa bajas. En base a estas observaciones Como puede explicar
la continuidad (o discontinuidad) de vo (t) en t = 0 cuando vi (t) es un
escalon?

C
+

+ vo
vi R

Figura 6.84. Circuito RC.

9. En este captulo se ha explicado como se obtienen las graficas de Bode


correspondientes a una funcion de transferencia conocida. Sin embargo,
tambien es posible el proceso inverso: dadas las graficas de Bode se puede
obtener la funcion de transferencia correspondiente. En este tipo de pro-
blemas las graficas de Bode son obtenidas experimentalmente y se dice
que al encontrar la funcion de transferencia correspondiente se ha identi-
ficado al sistema bajo estudio. En la figura 6.85 se muestran unas graficas
de Bode que se han obtenido experimentalmente. Encuentre la funcion de
transferencia correspondiente. Verifique su respuesta dibujando las grafi-
cas de Bode de la funcion de transferencia identificada y comparandolas
con las de la figura 6.85.
10. En el ejercicio 7 del captulo 2 se explica como obtener el modelo ma-
tematico de un voltmetro analogico de CD. Si se supone que la induc-
tancia del voltmetro es despreciable (L 0) el modelo se reduce a un
sistema masa-resorte-amortiguador giratorio (de segundo orden). Con es-
ta informacion en mente realice el siguiente experimento.
Conecte el voltmetro analogico en el modo de corriente directa.
Tome un generador de funciones y programelo para que genere una
forma de onda sinusoidal. Tambien programelo de manera que dicha
funcion sinusoidal de voltaje sea entregada montada sobre una compo-
nente de CD constante. El valor de esta componente de CD debe ser
igual a la mitad de la escala utilizada del voltmetro de CD. Ademas, el
generador de funciones debe entregar un voltaje cuyos valores maximo
6.12 Ejercicios propuestos 389

Bode Diagram

25

20

15
Magnitude (dB)

10

5
45

0
Phase (deg)

45

90
4 3 2 1 0 1 2 3
10 10 10 10 10 10 10 10
Frequency (rad/sec)

Figura 6.85. Graficas de Bode de una planta a identificar.

y mnimo (cuando aparece la funcion sinusoidal junto con la componen-


te de CD) no excedan la escala seleccionada del voltmetro analogico.
Conecte directamente a las terminales del voltmetro la salida del ge-
nerador de funciones. Aplique una senal sinusoidal de frecuencia y
obtenga los valores vmin y vmax como los valores mnimo y maximo
obtenidos en la escala del voltmetro analogico. Utilice un osciloscopio
para medir el voltaje de pico a pico de la senal sinusoidal entregada
por el generador de funciones y desgnelo como A. Utilice diferentes
valores de frecuencia y forme la siguiente tabla:

Tabla 6.4. Datos de respuesta en frecuencia de un voltmetro de CD.


B
, [rad/seg] B = vmax vmin , [Volts] A, [Volts] A
390 6 Diseno usando la respuesta en frecuencia

Con estos datos dibuje la grafica de Bode de magnitud correspondiente


y, a partir de ella, obtenga los valores numericos de la funcion de
transferencia G(s) = VVoi (s)
(s)
donde Vi (s) y Vo (s) son las transformadas
de la place del voltaje entregado por el generador de funciones y el
voltaje medido por el voltmetro, respectivamente. Notese que esta
funcion de transferencia debe ser de ganancia unitaria a frecuencia
cero porque a este valor de frecuencia es cuando un voltmetro de
CD entrega un valor correcto del voltaje medido. Notese tambien que
el valor de n es un dato que da informacion a cerca de cual es el
valor maximo de frecuencia a la cual el voltmetro de CD entrega
mediciones correctas. Esta parte del resultado depende mucho de que
el osciloscopio y el voltmetro entreguen la misma medicion de voltaje
a bajas frecuencias.
Referencias

1. E. Kreyszig, Matematicas avanzadas para ingeniera, Vol. 1, Limusa, Mexico,


1980.
2. H. P. Hsu, Analisis de Fourier, Fondo Educativo Interamericano, Mexico, 1973.
3. K. Ogata, Ingeniera de Control Moderna, 4a. edicion, Pearson Prentice-Hall,
Madrid, 2003.
4. N.S. Nise, Sistemas de control para ingeniera, 1a. edicion en espanol, 1a. Re-
impresion, CECSA, Mexico, 2004.
5. C.-T. Chen, Linear system theory and design, Holt, Rinehart and Winston, New
York, 1984.
6. Fundacion Thomas Alva Edison, Experimentos faciles e increbles, Ediciones
Roca, Mexico, 1993.
7. R.C. Dorf y R.H. Bishop, Sistemas de control moderno, 10a. edicion, Pearson
Prentice-Hall, Madrid, 2008.
8. B.C. Kuo, Sistemas de control automatico, 7a. edicion, Prentice-Hall Hispanoa-
mericana, Mexico, 1995.
9. G.H. Hostetter, C.J. Savant y R.T. Stefani, Sistemas de control, 1a. edicion en
espanol, McGraw-Hill, Mexico, 1992.
7
La tecnica de las variables de estado

A finales de la decada de 1950 llego la era de los vuelos espaciales. El


lanzamiento, direccionamiento, navegacion y seguimiento de naves espacia-
les consiste basicamente en el control de objetos balsticos. Estos problemas
requieren de la construccion de modelos fsicos detallados que puedan ser cons-
truidos en terminos de ecuaciones diferenciales, lineales y no lineales. Basados
en el trabajo de Poincare, los ingenieros que trabajaban en las industrias
aeroespaciales empezaron a formular los problemas de control en terminos de
un conjunto de ecuaciones diferenciales de primer orden. As nacio el enfoque
que hoy conocemos como el de las variables de estado.
394 7 La tecnica de las variables de estado

Objetivos del captulo

Entender el concepto de variables de estado.


Conocer las herramientas principales usadas en el enfoque de las variables
de estado.
Conocer la relacion entre la representacion en variables de estado y la
representacion en funcion de transferencia.
Analizar y disenar sistemas de control usando el enfoque de las variables
de estado.
Los metodos de diseno presentados en los captulos 5 y 6 constituyen la
base de lo que se conoce hoy en da como los metodos de Control Clasico. Una
de las caractersticas del control clasico es que se basa en el enfoque entrada-
salida dictado por el uso de la funcion de transferencia. Esto significa que una
funcion de transferencia es como una caja negra a la que se le aplica una senal
(la entrada) y solo se ve el efecto que se produce en la salida, es decir no se
sabe que es lo que ocurre en el interior de la caja negra. Una desventaja de
este metodo es que para disenar un sistema de control solo se puede utilizar
la informacion suministrada por una sola senal: la salida. Esto establece un
lmite en el desempeno que se puede conseguir.
La tecnica de las variables de estado se introduce con el fin de mejorar
algunos de los aspectos mencionados en el parrafo anterior. Por ejemplo, dado
que la variable de estado es una tecnica que permite utilizar la informacion
suministrada por todas las variables internas de un sistema, ademas de la
salida, es posible disenar sistemas de control que tienen mejores desempenos.
Esta es la idea fundamental detras del control por realimentacion del estado
que es explotado por la tecnica de las variables de estado.
El estudio formal de la tecnica de las variables de estado es un tema com-
plejo porque involucra el manejo de herramientas matematicas avanzadas. Sin
embargo, el objetivo de este captulo no es presentar una exposicion formal de-
tallada de esta tecnica sino presentar los conceptos basicos que permiten usar
esta tecnica para controlar plantas sencillas. As, solo se consideran plantas
que tienen una entrada y una salida y que son controlables y observables.

7.1. Representacion en variables de estado


Considere las siguientes dos ecuaciones diferenciales lineales de coeficientes
constantes:
di
L = u R i n ke (7.1)
dt
J = b + n km i (7.2)

Notese que cada una de estas ecuaciones diferenciales tiene efecto sobre la
otra ecuacion diferencial. Se dice que estas ecuaciones diferenciales deben ser
7.1 Representacion en variables de estado 395

resueltas simultaneamente. Una manera muy util de estudiar este tipo de


ecuaciones diferenciales es el enfoque de las variables de estado. Las variables
de estado pueden ser definidas de la siguiente manera.
Definicion 7.1 ( [1], pag. 83) Si se conoce la entrada u(t) para t t0 , las
variables de estado son el conjunto de variables cuyo conocimiento en t = t0
permite calcular la solucion de las ecuaciones diferenciales para todo t t0 .
Notese que las variables de estado se definen de una manera muy ambi-
gua. Aunque esto pudiera parecer una desventaja, sin embargo se convierte
en una ventaja porque permite que las variables de estado sean seleccionadas
de la manera que mas convenga. De acuerdo a esto, aunque en la literatura se
proponen varios criterios diferentes para seleccionar las variables de estado,
se debe entender que sin importar cual criterio se utilice las variables selec-
cionadas deben ser tales que permitan conocer la solucion de las ecuaciones
diferenciales para todo tiempo futuro. Siguiendo esta lnea de ideas en esta
obra se utilizara el siguiente criterio para seleccionar las variables de estado.
Criterio 7.1 Identifique la variable incognita de cada una de las ecuaciones
diferenciales involucradas. Identifique el orden de cada una de las ecuaciones
diferenciales y desgnelo como r. Seleccione las variables de estado como el
conjunto formado por las variables incognita y sus primeras r 1 derivadas
en cada una de las ecuaciones diferenciales involucradas. Tambien se pue-
de seleccionar a alguna de estas variables multiplicada por alguna constante
diferente de cero.
Es una costumbre usar la letra n para designar el numero de variables de
estado. Por otro lado, el estado es un vector cuyas componentes estan dadas
por cada una de las variables de estado. Entonces el estado es un vector de n
dimensiones. De acuerdo a este criterio las variables de estado seleccionadas
para las ecuaciones (7.1), (7.2) son i, , , por lo que n = 3 y el estado se
puede formar como el siguiente vector:

x1 i
x = x2 =
x3

Usando esta nomenclatura, las ecuaciones diferenciales en (7.1), (7.2) se pue-


den escribir como:

L x1 = u R x1 n ke x3 (7.3)
J x3 = b x3 + n km x1 (7.4)

o, de manera vectorial:

x1 (u R x1 n ke x3 )/L
d
x2 = x3 (7.5)
dt
x3 (b x3 + n km x1 )/J
396 7 La tecnica de las variables de estado

lo cual se puede escribir de manera compacta como:


x = Ax + Bu
R
L 0 nLke 1
L
A = 0 0 1 , B=0 (7.6)
n km
J 0 Jb 0
Por otro lado, se acostumbra usar la letra y para representar la salida a con-
trolar. Se debe resaltar que el estado x esta constituido por variables que son
internas al sistema y, por tanto, en general no se conocen y no se pueden
medir. En cambio, la salida y representa una variable que siempre se puede
medir. Si la salida se define como la posicion, es decir, si y = = x2 entonces
se puede escribir:
y = Cx, C = [0 1 0]
Al conjunto de las dos ecuaciones:
x = Ax + Bu (7.7)
y = Cx (7.8)
se le conoce como ecuacion dinamica lineal e invariante en el tiempo (A, B y
C son constantes). La ecuacion en (7.7) se conoce como ecuacion de estado y
la ecuacion en (7.8) se conoce como ecuacion de salida.
Aunque la ecuacion de estado en (7.7) se ha obtenido a partir de una
ecuacion diferencial que cuenta solo con una entrada, es decir u es un escalar,
es muy sencillo extender (7.7) al caso en el que existen p entradas, solo hay que
definir u como un vector de p componentes, cada una de las cuales representa
una entrada, y B debe ser definida como una matriz de n renglones y p
columnas. Por otro lado, tambien es muy sencillo generalizar la ecuacion de
salida en (7.8) al caso en que se tienen q salidas, solo hay que definir y como
un vector de q componentes, cada una de las cuales representa una salida, y
C debe ser definida como una matriz de q renglones y n columnas.
Notese que una ecuacion de estado esta constituida por un conjunto de
n ecuaciones diferenciales de primer orden. Una caracterstica de (7.7), (7.8),
es decir de una ecuacion dinamica lineal e invariante en el tiempo, es que
el miembro derecho de cada una de las ecuaciones diferenciales involucradas
en (7.7) esta dado como una combinacion lineal de las variables de estado y
la entrada a traves del uso de coeficientes constantes. Notese tambien que el
miembro derecho de (7.8) esta constituido por la combinacion lineal de las
variables de estado a traves del uso de coeficientes constantes.
Una propiedad fundamental de las ecuaciones de estado lineales e inva-
riantes en el tiempo es que satisfacen el principio de superposicion, lo cual es
logico ya que este tipo de ecuaciones de estado se obtienen, segun se acaba
de explicar, a partir de ecuaciones diferenciales lineales, ordinarias y de co-
eficientes constantes las cuales, segun se explica en la seccion 3.10, tambien
satisfacen el principio de superposicion.
7.1 Representacion en variables de estado 397

Ejemplo 7.1 Considere el sistema mecanico mostrado en la figura 7.1. El


modelo matematico correspondiente fue obtenido en el ejemplo 2.5 del captulo
2 y a continuacion se reescribe para facilitar la referencia

F(t) x1 K2 x2
K1 K3
m1 m2

Figura 7.1. Sistema mecanico.

b K1 K2 1
x1 + (x1 x2 ) + x1 + (x1 x2 ) = F (t) (7.9)
m1 m1 m1 m1
b K3 K2
x2 (x1 x2 ) + x2 (x1 x2 ) = 0 (7.10)
m2 m2 m2
Notese que se tienen dos ecuaciones diferenciales de segundo orden cada una.
Esto significa que solo habran cuatro variables de estado: la incognita de cada
una de estas ecuaciones diferenciales, es decir x1 y x2 , y la primer derivada
de cada una de estas incognitas, es decir x1 y x2 :

x1 x1
x2 x2

x= = , u = F (t)
x3 x1
x4 x2

Usando esta nomenclatura, las ecuaciones diferenciales en (7.9), (7.10) se


pueden escribir como:
b K1 K2 1
x1 = x3 = (x3 x4 ) x1 (x1 x2 ) + u
m1 m1 m1 m1
b K3 K2
x2 = x4 = (x3 x4 ) x2 + (x1 x2 )
m2 m2 m2
o, de manera vectorial:

x1 x3
d
x2 = b x4

K1 K2 1 (7.11)
dt x3 m1 (x 3 x4 ) x
m1 1 m1 (x1 x2 ) + m1 u
b K3 K2
x4 m2 (x3 x 4 ) x
m2 2 + m2 (x1 x 2 )

de donde se obtiene la ecuacion de estado:


398 7 La tecnica de las variables de estado

x = Ax + Bu

0 0 1 0 0
0 0 0 1 0
A= K1 K2 K2 b ,
B= (7.12)
m
1
m1 m1 mb1 m1
1
m1
K2 K2 K3 b
m2 m 2
m2 m2 mb2 0

Por otro lado, la ecuacion de salida depende de que se desea controlar. Por
ejemplo, si lo que interesa controlar es la posicion de la masa 1 entonces:

y = Cx = x1 , C = [1 0 0 0]

pero si se desea controlar la posicion de la masa 2 entonces:

y = Cx = x2 , C = [0 1 0 0]

Ejemplo 7.2 En el captulo 12 se estudia un mecanismo conocido como el


sistema ball and beam. En ese captulo se obtiene el modelo matematico corres-
pondiente y se presenta en la ecuacion (12.16). A continuacion se reescribe
dicho modelo con el fin de facilitar la referencia:
X(s) k
= 2, (s) = I (s)
(s) s s(s + a)
Usando la transformada inversa de Laplace se pueden recuperar las ecuacio-
nes diferenciales de las que se han obtenido las funciones de transferencia
involucradas en las expresiones anteriores, es decir:

x = , + a = ki (7.13)

Como se trata de dos ecuaciones diferenciales de segundo orden entonces ha-


bra cuatro variables de estado: las incognitas de cada ecuacion diferencial, es
decir x y , y las primeras derivadas de dichas incognitas, es decir x y :

z1 x
z2 x
z=
z3 = , u = i

z4

Usando esta nomenclatura, las ecuaciones diferenciales en (7.13) se pueden


escribir como:

x = z2 = z3 , = z4 = az4 + ku

o, de manera vectorial:

z1 z2
d
z2 = z3

(7.14)
dt z 3 z 4
z4 az4 + ku
7.2 Linealizacion aproximada 399

de donde se obtiene la ecuacion de estado:

z = Az + Bu

010 0 0
0 0 0 0
A= 0 0 0 1 ,
B=
0
(7.15)
0 0 0 a k

Tal como se explica en el captulo 12 la variable que se desea controlar es x


y, por tanto, la ecuacion de salida esta dada como:

y = Cz = x = z1 , C = [1 0 0 0]

7.2. Linealizacion aproximada de ecuaciones de estado


no lineales
Es muy frecuente encontrar ecuaciones de estado que no son lineales, es
decir, ecuaciones de estado dadas como:

x = f (x, u) (7.16)

f1 (x, u) x1 u1
f2 (x, u) x2 u2

f = .. , x = . , u= .
. .. ..
fn (x, u) xn up

donde al menos una de las funciones fi (x, u), i = 1, . . . , n, es una funcion


escalar no lineal de x y/o de u, es decir, que no se puede escribir como una
combinacion lineal de las componentes de x y/o de u. Por ejemplo, para una
ecuacion de estado con tres variables de estado y dos entradas se puede tener:

fi (x, u) = 3 sin(x3 ) + x1 u2
ex1
fi (x, u) =
5x2
fi (x, u) = u21

Es importante subrayar que la notacion fi (x, u) significa que la componente i


del vector f es funcion, en general, de las componentes de los vectores estado
x y entrada u. Sin embargo, tal como se muestra en los ejemplos anteriores, no
es forzoso que fi (x, u) sea funcion de todas las variables de estado y de todas
la entradas. Mas aun, puede darse el caso en que fi (x, u) no es funcion de
ninguna variable de estado pero s lo es de algunas entradas y viceversa. Una
ecuacion de estado de la forma (7.16) que tiene las caractersticas mencionadas
se conoce como una ecuacion de estado no lineal invariante en el tiempo (no
depende explcitamente del tiempo).
400 7 La tecnica de las variables de estado

El estudio de ecuaciones de estado no lineales es mucho mas complejo


que el estudio de ecuaciones de estado lineales. Sin embargo, la mayora de los
procesos fsicos que son de interes para los ingenieros de control son no lineales
por naturaleza, es decir, sus modelos tienen la forma dada en (7.16). As que
deben desarrollarse metodos de estudio y diseno para este tipo de ecuaciones
de estado. Uno de los metodos mas sencillos consiste en encontrar una ecuacion
de estado lineal como la mostrada en (7.7) que represente satisfactoriamente la
evolucion de (7.16). La ventaja de este metodo es que las ecuaciones de estado
lineales de la forma (7.7) pueden ser estudiadas con mayor facilidad. Entonces
el analisis y el diseno de controladores para (7.16) se realizan utilizando un
modelo mas sencillo de la forma (7.7). Aunque este metodo es muy util se debe
mencionar que su principal desventaja es que los resultados que se obtienen
solo son validos en una region restringida del espacio de trabajo del proceso
que se desea controlar. En las siguientes secciones se explican en detalle todas
estas ideas.

7.2.1. Procedimiento para ecuaciones de primer orden sin


entrada
Considere una ecuacion diferencial no lineal de primer orden sin entrada:
x = f (x) (7.17)
donde x es un escalar y f (x) es una funcion no lineal de x. Se desea obtener

h (x )
f (x )

f (x )
x x

Figura 7.2. Aproximacion de una funcion no lineal f (x) usando una linea recta
h(x).

una ecuacion diferencial lineal que represente a (7.17) al menos de manera


7.2 Linealizacion aproximada 401

aproximada. Defnase un punto de equilibrio x de (7.17) como aquel valor


de x que satisface f (x ) = 0. De acuerdo a (7.17) esto significa que en un
punto de equilibrio x = f (x ) = 0, es decir, el sistema puede permanecer en
reposo en ese punto. En terminos practicos esto significa que un punto de
equilibrio x representa la configuracion constante en la que puede mantenerse
sin movimiento un robot, por ejemplo, bajo la accion de la gravedad.
Suponga que f (x) esta representada por la curva que se muestra en la
figura 7.2. La linea recta punteada h(x) es tangente a f (x) en el punto x .
Debido a esta caracterstica, h(x) y f (x) son aproximadamente iguales para
valores de x que sean cercanos a x , es decir, si x x 0. Sin embargo,
la diferencia entre h(x) y f (x) crece conforme los valores de x se alejan de
x , es decir, para valores grandes de x x . As que se puede usar h(x) en
lugar de f (x) si la variable x se restringe a tomar solamente valores que sean
cercanos a x . En el caso del ejemplo del robot, esto significa que aunque s se
permitira que el robot se mueva, sin embargo estos movimientos no deben ser
tales que la configuracion del robot sufra cambios demasiado grandes respecto
de su configuracion de equilibrio o reposo. En la figura 7.2 se observa que:

h(x) f (x ) df (x)
m= , m= (7.18)
x x dx x=x

donde la constante m es la pendiente de h(x), es decir, la derivada de f (x)


evaluada en el punto de punto de equilibrio x . Entonces, de la primera ex-
presion:

h(x) = m(x x ) + f (x ) (7.19)

y debido a que h(x) f (x), se puede escribir:

f (x) m(x x ) + f (x ) (7.20)

Como x es un punto de equilibrio entonces f (x ) = 0 y se obtiene:

f (x) m(x x ) (7.21)

Entonces la ecuacion (7.17) se puede aproximar por:

x = m(x x ) (7.22)

Definiendo una nueva variable z = x x , se tiene z = x, porque x = 0. Por


tanto, la aproximacion lineal de (7.17) esta dada por:

z = m z (7.23)

la cual es valida solamente bajo la restriccion x x 0. Una vez que se usa


(7.23) para calcular z se puede usar z = x x para obtener x ya que el punto
de equilibrio x es conocido.
402 7 La tecnica de las variables de estado

7.2.2. Procedimiento general para ecuaciones de orden arbitrario


y numero de entradas arbitrario

Considere ahora la ecuacion diferencial:

x = f (x, u) (7.24)

donde x Rn es un vector de n dimensiones y u Rp es un vector de p


dimensiones que representa la entrada o excitacion de la ecuacion diferencial.
Notese que f (x) debe ser una funcion vectorial de n dimensiones. Esto sig-
nifica que (7.24) tiene la forma definida en (7.16). En este caso se prefiere
usar el concepto punto de operacion en lugar de punto de equilibrio ya
que este ultimo concepto se define solamente para ecuaciones diferenciales sin
entradas. Un punto de operacion se define como aquella pareja (x , u ) tal que
f (x , u ) = 0. Esto significa que la solucion de la ecuacion diferencial puede
permanecer en reposo en el valor constante x , porque x = f (x , u ) = 0,
si se aplican las entradas adecuadas u (p entradas) que tambien resultan ser
constantes.
Notese que f (x, u) depende de n + p variables. Defnase el siguiente vector:

x
y= (7.25)
u

de n + p dimensiones. Entonces (7.24) se puede escribir como:

x = f (y) (7.26)

Siguiendo las ideas de la seccion previa, se desea aproximar la funcion no


lineal f (y) mediante una funcion h(y) que sea tangente a f (y) en el punto
de operacion y definido como:

x
y =
u

Generalizando la expresion en (7.19) al caso de n+p variables se puede escribir:

h(y) = M (y y ) + f (y ) (7.27)


donde M = fy(y) es una matriz constante definida como:
y=y

f1 (x,u) f1 (x,u) f1 (x,u) f1 (x,u) f1 (x,u) f1 (x,u)
x1 x2 ... xn u1 u2 ... up
f2 (x,u) f2 (x,u) f2 (x,u) f2 (x,u) f2 (x,u) f2 (x,u)
... ...
x1 x2 xn u1 u2 up
M = .. .. .. .. .. .. .. ..
. . . . . . . .

fn (x,u) fn (x,u) fn (x,u) fn (x,u) fn (x,u) fn (x,u)
x1 x2 ... xn u1 u2 ... up x=x ,u=u

Usando f (y) h(y) se puede aproximar (7.26) por:


7.2 Linealizacion aproximada 403

x = M (y y ) + f (y ) (7.28)

Como f (y ) = f (x , u ) = 0 y x x = x, porque x = 0, se tiene:

z = Az + Bv (7.29)
f1 (x,u) f1 (x,u) f1 (x,u)

x1 x2 ... xn
f2 (x,u) f2 (x,u) f2 (x,u)
x1 x2 ... xn
A=
.. .. .. ..

(7.30)
. . . .
fn (x,u) fn (x,u) fn (x,u)
x1 x2 ... xn x=x ,u=u

f1 (x,u) f1 (x,u) f1 (x,u)
u1 u2 ... up
f2 (x,u) f2 (x,u) f2 (x,u)
...
u1 u2 up
B= .. .. .. .. (7.31)
. . . .

fn (x,u) fn (x,u) fn (x,u)
u1 u2 ... up x=x ,u=u

donde se ha definido z = x x y v = u u . Las expresiones (7.29), (7.30),


(7.31) constituyen el modelo lineal aproximado que se utiliza para el estudio
y el diseno de controladores para el sistema no lineal en (7.24). Notese que
este modelo lineal aproximado solo es valido si el estado x y la entrada u son
tales que no se alejan mucho del punto de operacion (x , u ), es decir, solo si
z = x x 0 y v = u u 0. Normalmente es difcil determinar desde el
punto de vista practico cuales valores de x y de u satisfacen estas condiciones
y lo que se hace es simplemente limitar sus variaciones de manera emprica.
Ejemplo 7.3 En la figura 7.3 se muestra un pendulo simple. En el ejemplo
2.13 del captulo 2 se encontro que el modelo matematico correspondiente
esta dado por la siguiente ecuacion diferencial no lineal:

T(t)

l

g
m

Figura 7.3. Pendulo simple.

ml2 + b + mgl sin() = T (t) (7.32)


404 7 La tecnica de las variables de estado

La caracterstica de ser una ecuacion diferencial no lineal es determinada


exclusivamente por la funcion sin() que aparece por efecto de la gravedad. Al
tratarse de una ecuacion diferencial de segundo orden, entonces solo hay dos
estados: la incognita y su primer derivada :

x1
x= = , u = T (t)
x2

Usando esta nomenclatura, la ecuacion diferencial en (7.32) se puede escribir


como:
b g 1
= x2 = 2
x2 sin(x1 ) + u
ml l ml2
o, de manera vectorial:

d x1 x2
= g (7.33)
dt x2 mlb 2 x2 l sin(x1 ) +
1
ml2 u

de donde se obtiene la ecuacion de estado:

x = f (x, u)

f1 (x, u) x2
f (x, u) = = g
f2 (x, u) mlb 2 x2 l sin(x1 ) +
1
ml2 u

Notese que en este caso no se puede obtener la forma lineal x = Ax+Bu debido
a la presencia de la funcion sin(). Con el fin de obtener una aproximacion
lineal de esta ecuacion de estado no lineal, primero se encuentran los puntos
de operacion, es decir las parejas (x , u ) que satisfacen f (x , u ) = [0 0]T :

x2 0
f (x , u ) = =
mlb 2 x2 gl sin(x1 ) + ml1 2 u 0

de donde se obtiene:

x2 = 0, u = mgl sin(x1 )

Esto significa que el valor de la entrada, en el punto de operacion, depende


del valor de la posicion del pendulo en el punto de operacion. Esto es debido a
que, para mantener al pendulo en reposo, es necesario que la entrada compense
de manera exacta al efecto de la gravedad. Para continuar, debe seleccionarse
algun valor especfico para x1 . Aqu se consideraran dos casos:
Cuando x1 = 0, x2 = 0, u = 0. Usando las expresiones en (7.29), (7.30),
(7.31) se encuentra que:

z = Az + Bv
" #
f1 (x,u) f1 (x,u)
x1 x2 0 1
A= =
f2 (x,u) f2 (x,u)
x1 x2
gl cos(x1 ) mlb 2 x1 =x2 =u=0
x=x ,u=u
7.2 Linealizacion aproximada 405

0 1
=
gl mlb 2
" #
f1 (x,u)
u 0
B= f2 (x,u) = 1
u ml2
x=x ,u=u

donde se ha definido z = x x = x y v = u u = u. Notese que esta


ecuacion de estado especifica que:
g b 1
z1 = z2 , z2 = z1 z2 + v
l ml2 ml2
Al combinar estas dos ecuaciones diferenciales de primer orden se obtiene
la siguiente ecuacion diferencial de segundo orden, lineal y de coeficientes
constantes:
b g 1
z1 + 2
z1 + z1 = v (7.34)
ml l ml2
La cual puede ser analizada utilizando los conceptos vistos en las secciones
3.3 (races complejas conjugadas con parte real menor o igual a cero),
3.5 (races reales, repetidas y negativas) y 3.4 (races reales, diferentes y
negativas) del captulo 3, ya que corresponde a una ecuacion diferencial de
la forma:

y + 2n y + n2 y = kn2 v

donde:
b g 1
y = z1 , 2n = , n2 = , k=
ml2 l mgl
con 0, n > 0 y k > 0 porque m > 0, g > 0, l > 0 y b 0.
Cuando x1 = , x2 = 0, u = 0. Usando las expresiones en (7.29),
(7.30), (7.31) se encuentra que:

z = Az + Bv
" #
f1 (x,u) f1 (x,u)
x1 x2 0 1
A= =
f2 (x,u) f2 (x,u)
x1 x2
gl cos(x1 ) mlb 2 x1 =,x2 =u=0
x=x ,u=u

0 1
= g
l mlb 2
" #
f1 (x,u)
u 0
B= f2 (x,u) = 1
u ml2
x=x ,u=u

donde se ha definido z = x x = [x1 x1 , x2 ]T y v = u u = u. Notese


que esta ecuacion de estado especifica que:
406 7 La tecnica de las variables de estado

g b 1
z1 = z2 , z2 = z1 2
z2 + v
l ml ml2
Al combinar estas dos ecuaciones diferenciales de primer orden se obtiene
la siguiente ecuacion diferencial de segundo orden, lineal y de coeficientes
constantes:
b g 1
z1 + 2
z1 z1 = v (7.35)
ml l ml2
La cual puede ser analizada utilizando los conceptos vistos en la seccion
3.4 del captulo 3 (races reales, diferentes, una positiva y la otra negativa,
vease el ejemplo 3.9) ya que corresponde a una ecuacion diferencial de la
forma:

y + cy + dy = ev

donde:
b g 1
y = z1 , c= 0, d= < 0, e=
ml2 l ml2
Notese que de acuerdo a (7.34) y a la seccion 3.3 del captulo 3, cuando el
pendulo funciona alrededor del punto de operacion x1p= 0, x2 = 0, u = 0,
g
oscila con una frecuencia natural dada como n = l . Esto significa que
un pendulo mas largo oscila mas lentamente mientras que un pendulo mas
corto oscila mas rapidamente. Estas observaciones son utiles, por ejemplo,
cuando se desea ajustar la rapidez de un reloj de pendulo que se atrasa o
se adelanta. Mas aun, reacomodando (7.34) se obtiene:

ml2 z1 + bz1 + mglz1 = v (7.36)

De acuerdo al ejemplo 2.6 del captulo 2 que trata sobre el sistema masa-
resorte-amortiguador rotativo mostrado en la figura 7.4, (7.36) significa que
el factor K = mgl > 0 equivale al coeficiente de rigidez de un resorte que es
introducido por el efecto de la gravedad. Por otro lado, usando argumentos

b K
I

T(t)

Figura 7.4. Sistema masa-resorte-amortiguador rotativo.

similares se observa que, reacomodando (7.35):

ml2 z1 + bz1 mglz1 = v


7.3 Algunos resultados del algebra lineal 407

cuando el pendulo funciona alrededor de los puntos de operacion x1 = ,


x2 = 0, u = 0, su comportamiento es analogo al de un sistema masa resorte
amortiguador que cuenta con un resorte con coeficiente de rigidez negativo
K = mgl < 0. Esto puede verse del siguiente modo. Un coeficiente de rigidez
positivo K > 0 indica que la fuerza ejercida por el resorte siempre va dirigida
en sentido contrario a la deformacion y por eso el resorte forza al cuerpo a
regresar a la posicion donde el resorte no esta deformado. Esa es la razon
por la que el pendulo oscila alrededor del punto de operacion x1 = 0, x2 = 0,
u = 0. Por otro lado y debido al cambio de signo, un resorte con coeficiente
de rigidez negativo K < 0 debe hacer lo contrario, es decir, la fuerza ejercida
por el resorte ahora va dirigida en el mismo sentido que la deformacion. Esto
significa que al deformarse el resorte con K < 0 este forza a que el resorte se
deforme aun mas por lo que el cuerpo se aleja de la configuracion en la que el
resorte tiene deformacion cero (es decir donde z1 = 0). Esto es precisamente
lo que sucede con el pendulo alrededor de los puntos de operacion x1 = ,
x2 = 0, u = 0: si z1 6= 0 entonces la fuerza de la gravedad forza al pendulo
a caer y, por tanto a alejarse cada vez mas de la configuracion donde z1 =
0, es decir donde x1 = x1 = . Este comportamiento es la comprobacion
experimental de lo que analticamente queda demostrado al tener un polinomio
caracterstico con una raz positiva: los puntos de operacion x1 = , x2 = 0,
u = 0 son inestables.

Se recomienda consultar las secciones 11.2 (en el captulo 11), 13.2 (en el
captulo 13) y 14.4 (en el captulo 14) para ver otros ejemplos de como utilizar
las expresiones en (7.29), (7.30), (7.31) para encontrar ecuaciones de estado
lineales aproximadas de ecuaciones de estado no lineales.

7.3. Algunos resultados del algebra lineal

En esta seccion se presentan algunos resultados que son utiles para el


estudio de la tecnica de las variables de estado.
Resultado 7.1 ( [1], cap. 2) Sean w1 , w2 , . . . , wn , n vectores de n componen-
tes cada uno. Estos vectores son linealmente dependientes si y solo si existen
n escalares 1 , 2 , . . . , n , no todos cero tales que:

1 w1 + 2 w2 + . . . + n wn = 0 (7.37)

donde el cero del lado derecho representa un vector de n componentes todas


ellas con valor cero. Si la unica manera de satisfacer la expresion anterior es
que 1 = 2 = . . . = n = 0 entonces se dice que w1 , w2 , . . . , wn , son vectores
linealmente independientes.
En la version mas simple de la dependencia lineal de vectores, dos vectores de
dos componentes son linealmente dependientes si son paralelos. Esto puede
408 7 La tecnica de las variables de estado

verse del siguiente modo. Sean w1 y w2 dos vectores de n = 2 componentes ca-


da uno. Estos vectores son linealmente dependientes si existen dos constantes
1 6= 0 y 2 6= 0 tales que:
1 w1 + 2 w2 = 0
lo cual significa que se puede escribir:
2
w1 = w2
1
Notese que 1 no puede ser cero por razones obvias. Por otro lado, si 2 fuera
igual a cero entonces w1 = 0 es la unica posibilidad por lo que no interesa este
caso y, por tanto, se supone que ambos 1 6= 0 y 2 6= 0. Por tanto, como el
2
factor 1
es un escalar (positivo o negativo), lo anterior significa que w1 y
w2 son vectores que tienen la misma direccion, es decir, que son paralelos1 .
Cuando se tienen 3 o mas vectores, entonces la dependencia lineal signi-
fica que uno (aunque no todos) de los vectores puede ser obtenido mediante
la suma de los otros vectores cuando son amplificados convenientemente
usando las ganancias i (esto es lo que se conoce como combinacion lineal
de vectores). Es decir:
2 3
w1 = w2 w3
1 1
se obtiene directamente de (7.37) cuando n = 3 y 1 6= 0. Como n = 3, esto
significa que w1 , w2 y w3 pertenecen a un mismo plano (o una linea recta, en
el peor de los casos) que esta incrustado en un volumen (en R3 ), es decir, que
la combinacion lineal de w1 , w2 y w3 no permite obtener otro vector (o vecto-
res) que no pertenezcan a dicho plano. De acuerdo a todo esto, tres vectores
de 3 componentes son linealmente independientes si la combinacion lineal de
ellos permite generar vectores que cubren por completo tres dimensiones.
Generalizando, la combinacion lineal de n vectores (de n componentes) lineal-
mente independientes cubre un espacio de n dimensiones. La combinacion
lineal de n vectores (de n componentes) linealmente dependientes cubre un
espacio con un numero de dimensiones menor que n.
Resultado 7.2 ( [1], cap. 2, [2], cap. 10) Sea la siguiente matriz de n n:

E = w1 w2 . . . wn
donde w1 , w2 , . . . , wn , son n vectores columna de n componentes. Los vecto-
res w1 , w2 , . . . , wn son linealmente independientes si y solo si la matriz E es
no singular, es decir, si y solo si el determinante de E es diferente de cero
(det(E) 6= 0).
1
Algunos autores usan el termino antiparalelos para designar dos vectores que
tienen la misma direccion pero sentido contrario. En esta obra se utiliza el termino
paralelos para designar dos vectores que tienen la misma direccion sin importar
su sentido.
7.3 Algunos resultados del algebra lineal 409

Para explicar este resultado se hace uso de lo siguiente.


Resultado 7.3 ([1], cap. 2) Suponga una matriz E de n n. La unica solu-
cion de la expresion Ew = 0, donde w representa un vector de n componentes,
es w = 0 si y solo si la matriz E es no singular.
Notese que la suma de vectores mostrada en (7.37) se puede escribir como:

1 0

2 0

1 w1 + 2 w2 + . . . + n wn = w1 w2 . . . wn . = .
.. ..
n 0

De acuerdo al resultado 7.3, el vector [1 2 . . . n ] = [0 0 . . . 0] es la unica


solucion de este sistema homogeneo si y solo si la matriz E = [w1 w2 . . . wn ]
es no singular. Esto implica que los vectores w1 , w2 , . . . , wn son linealmente
independientes si y solo si det(E) 6= 0.
Resultado 7.4 ([1], cap. 2) El rango de una matriz E de n n es el orden
del determinante mas grande y diferente de cero que puede formarse con los
elementos de E. El rango de E es n si y solo si E es no singular. La matriz
inversa E 1 existe si y solo si la matriz E es no singular [2], cap. 10.
Resultado 7.5 ([1], cap. 2) Los eigenvalores de una matriz E de n n son
aquellos escalares que satisfacen:

det(I E) = 0

donde I representa la matriz identidad de n n. La expresion det(I E)


es un polinomio de grado n en la variable y se conoce como el polinomio
caracterstico de la matriz E. Los eigenvalores de una matriz E pueden ser
numeros reales o complejos. La matriz E tiene exactamente n eigenvalores
incluyendo aquellos que se puedan repetir.
Resultado 7.6 ([3], cap. 7) Suponga que dos matrices E y E, ambas de nn,
se relacionan a traves de:

E = P EP 1 (7.38)

donde P es una matriz constante y no singular de n n, entonces ambas


matrices E y E tienen los mismos eigenvalores. Esto significa que:

det(I E) = det(I E) (7.39)

Para explicar esto es de mucha utilidad lo siguiente.


Resultado 7.7 ([4], pag. 303) Sean D y G dos matrices de n n. Entonces:

det(DG) = det(D) det(G) (7.40)


410 7 La tecnica de las variables de estado

Como P P 1 = I y det(I) = 1, entonces usando (7.40) se encuentra que


1
det(P ) det(P 1 ) = 1, es decir det(P 1 ) = det(P ) . Por otro lado, de acuerdo a
(7.38), (7.40), el polinomio caracterstico de E es:

det(I E) = det(I P EP 1 ) = det(P [I E]P 1 )


= det(P ) det(I E) det(P 1 ) = det(I E)

Notese que en la ultima expresion se ha recuperado (7.39), lo que comprueba


ese resultado.
Resultado 7.8 ([4], pag. 334) Sean E y F dos matrices de nn con F = E T .
Los eigenvalores de F son identicos a los eigenvalores de E.
Para explicar esto es de mucha utilidad lo siguiente.
Resultado 7.9 ([2], pag. 504) El determinante de una matriz E es igual a
la suma de los productos de los elementos de cualquier columna o renglon de
E y sus respectivos cofactores.
Resultado 7.10 ([2], pag. 507) Si det(D) es un determinante cualquiera
y det(G) es el determinante cuyos renglones son las columnas de det(D),
entonces det(D) = det(G).
De acuerdo a lo anterior, det(I E) puede calcularse usando, por ejemplo,
la primera columna de la matriz I E, mientras que det(I F ) se puede
calcular usando, por ejemplo, el primer renglon de la matriz I F . Notese
que la primera columna de I E es igual al primer renglon de I F ya
que (I E)T = I F debido a que F = E T . Por esta misma razon, los
renglones del cofactor del elemento en el renglon i y la columna 1 en la matriz
I E son iguales a las columnas del cofactor del elemento en el renglon 1 y
la columna i en la matriz I F . Esto demuestra que E y F tienen el mismo
polinomio caracterstico, es decir que:

det(I E) = det(I F ) (7.41)

y por tanto, los eigenvalores de F son iguales a los eigenvalores de E.

7.4. Solucion de una ecuacion dinamica, lineal e


invariante en el tiempo
El calculo de la solucion de la ecuacion dinamica:

x = Ax + Bu, x Rn , uR (7.42)
y = Cx, yR (7.43)

es un problema complejo que require del manejo de conceptos avanzados de


algebra lineal y calculo que estan fuera del alcance de esta obra. Sin embargo,
7.4 Solucion de una ecuacion dinamica 411

se pueden explicar las ideas fundamentales involucradas en el procedimiento


correspondiente si se establece una analoga con el problema de resolver la
siguiente ecuacion diferencial de primer orden:
x = ax + bu, x, u R
Aplicando la transformada de Laplace se tiene:
sX(s) x(0) = aX(s) + bU (s)
donde X(s), U (s) representan, respectivamente, las transformadas de Laplace
de x y u. Esto se puede escribir del siguiente modo:
b x(0)
X(s) = U (s) + (7.44)
sa sa
Usando los pares transformados [5]:
1
L eat = = G(s) (7.45)
sa
Z t
b
L g(t )bu( )d = U (s), (convolucion)
0 s a
g(t) = L1 {G(s)}
se encuentra que, al aplicar la transformada inversa da Laplace a (7.44), se
obtiene:
Z t
x(t) = g(t )bu( )d + eat x(0)
0

Finalmente, usando (7.45) de nuevo se encuentra:


Z t
x(t) = eat x(0) + ea(t ) bu( )d, x, u, a, b R
0

La solucion de la ecuacion de estado en (7.42) es similar a esta ultima ecuacion


y solo se debe utilizar notacion matricial, es decir, la solucion de (7.42) es [1],
pag. 142:
Z t
At
x(t) = e x(0) + eA(t ) Bu( )d, x Rn , u R (7.46)
0

donde e es una matriz de n n (notese que eA(t ) = eAr |r=t ) y a


At

continuacion se explica como esta dada.


Si es un eigenvalor real (positivo, negativo o cero) y no repetido de la
matriz A entonces al menos uno de lo elementos de la matriz eAt incluye
la siguiente funcion:
cet
donde c es una constante real.
412 7 La tecnica de las variables de estado

Si es un eigenvalor real (positivo, negativo o cero) y repetido r veces de


la matriz A entonces cada una de las siguientes funciones:

c0 et , c1 tet , c2 t2 et , ..., cr1 tr1 et

donde ck , k = 1, 2, . . . , r 1, son constantes reales, esta incluida en al


menos uno de los elementos de la matriz eAt .
Si = a+jb es un eigenvalor complejo de la matriz A donde j = 1 con a
un numero real (positivo, negativo o cero) y b un numero real estrictamente
positivo, si el complejo conjugado de tambien es un eigenvalor de la
matriz A y si estos eigenvalores no estan repetidos entonces cada una de
las siguientes funciones:

ceat sin(bt), deat cos(bt)

donde c y d son constantes reales, esta incluida en al menos uno de los


elementos de la matriz eAt .
Si = a+jb es un eigenvalor complejo de la matriz A donde j = 1 con a
un numero real (positivo, negativo o cero) y b un numero real estrictamente
positivo, si el complejo conjugado de tambien es un eigenvalor de la
matriz A y si estos eigenvalores estan repetidos r veces entonces cada una
de las siguientes funciones:

c0 eat sin(bt), , c1 teat sin(bt), c2 t2 eat sin(bt), . . . , cr1 tr1 eat sin(bt)
d0 eat cos(bt), , d1 teat cos(bt), d2 t2 eat cos(bt), . . . , dr1 tr1 eat cos(bt)
(7.47)

donde ck y dk , k = 1, 2, . . . , r 1, son constantes reales, esta incluida en


al menos uno de los elementos de la matriz eAt .
Finalmente, la salida de la ecuacion dinamica en (7.42), (7.43) se calcula
usando (7.46) como:
Z t
y(t) = CeAt x(0) + C eA(t ) Bu( )d (7.48)
0

7.5. Estabilidad de una ecuacion dinamica


De particular interes resulta el estudio de la estabilidad de la siguiente
ecuacion dinamica sin entrada:

x = Ex (7.49)
y = Cx

donde x Rn , y R, E es una matriz constante de n n y C es un vec-


tor renglon constante de n componentes. Aunque una ecuacion dinamica sin
7.6 Controlabilidad y observabilidad 413

entrada puede parecer algo que no corresponde a la realidad, sin embargo en


la seccion 7.10 se muestra que una ecuacion dinamica realimentada puede ser
escrita en la forma (7.49), debido a que en un sistema realimentado la entrada
se escoge como u = Kx donde K es un vector renglon de n componentes.
Entonces, sustituyendo esta entrada en (7.42) y definiendo E = A BK se
encuentra (7.49). Esta es la principal motivacion para estudiar la estabilidad
de dicha ecuacion dinamica sin entrada.
Aunque definicion formal de la estabilidad de (7.49) es algo elaborada,
podemos simplificarla diciendo que la ecuacion dinamica (7.49) es estable si
lmt x(t) = 0 (y por tanto, lmt y(t) = 0 tambien) para cualquier estado
inicial x(0) Rn . Esto significa que si:

x1 (t)
x2 (t)

x(t) = .
..
xn (t)

entonces lmt xi (t) = 0 para toda i = 1, 2, . . . , n, y a partir de cualquier


estado inicial. De acuerdo a la solucion encontrada en (7.46), la solucion de
(7.49) se encuentra usando u = 0 y A = E en (7.46), es decir:

x(t) = eEt x(0)

Como x(0) es un vector constante, la expresion anterior implica que si se ha de


conseguir que lmt x(t) = 0 entonces se debe conseguir que lmt eEt = 0
donde el 0 representa una matriz de n n con todos sus elementos iguales
a cero. De acuerdo a lo expuesto en la seccion previa a cerca de como estan
formados los elementos de la matriz eAt (recuerde que A = E) se llega a la
siguiente conclusion:
Teorema 7.1 ([1], pag. 409) La solucion de (7.49) satisface lmt x(t) = 0,
sin importar cual sea el estado inicial x(0), si y solo si todos los eigenvalores
de la matriz E tienen parte real estrictamente negativa. Se dice que bajo estas
condiciones el origen x = 0 de (7.49) es globalmente asintoticamente estable.
Para comprobar esto es de mucha utilidad recordar que en la seccion 3.5
del captulo 3 se ha demostrado que

lm tj ept = 0
t

para cualquier j > 0 entero y cualquier numero real p < 0.

7.6. Controlabilidad y observabilidad


Dos propiedades importantes de la ecuacion dinamica
414 7 La tecnica de las variables de estado

x = Ax + Bu, x Rn , u R (7.50)
y = Cx, y R (7.51)

que seran utilizadas a lo largo de este captulo son la controlabilidad y la


observabilidad. A continuacion se definen y estudian estas propiedades.

7.6.1. Controlabilidad

Definicion 7.2 ([1], pag. 176) Una ecuacion de estado es controlable en el


instante t0 si existe un tiempo finito t1 > t0 tal que dados cualquiera dos
estados x0 y x1 existe una entrada u que aplicada desde t = t0 hasta t = t1
consigue trasferir el estado desde x0 en t = t0 hasta x1 en t = t1 . De otro
modo la ecuacion de estado es no controlable.

Notese que esta definicion no especifica la trayectoria que se deba seguir


para transferir el estado desde x0 hasta x1 por lo que queda en total liber-
tad. Ademas, no es necesario que el estado del sistema permanezca en x1
para instantes posteriores a t1 . Notese tambien que la controlabilidad es una
propiedad que solo tiene que ver con la entrada, es decir con la ecuacion de
estado, por lo que la ecuacion de salida no juega ningun papel. Finalmente,
esta definicion es muy general pues tambien considera la posibilidad de que
la ecuacion de estado sea variante en el tiempo, es decir, que los elementos de
A y B sean funciones del tiempo.
En el caso de una ecuacion de estado invariante en el tiempo como la
mostrada en (7.50), es decir cuando los elementos de A y B son constantes, si
la ecuacion de estado es controlable entonces lo es para cualquier t0 0 y el
instante t1 es cualquier valor tal que t1 > t0 , es decir, la transferencia desde x0
a x1 puede ser realizada en cualquier intervalo de tiempo de duracion no zero.
Esto permite obtener una manera muy simple de verificar si una ecuacion de
estado es controlable:

Teorema 7.2 ([6], pag. 145) La ecuacion de estado en (7.50) es controlable si


y solo si cualquiera de las dos siguientes condiciones equivalentes se satisface:
1. La siguiente matriz de n n:
Z t Z t T
T
Wc (t) = eA BB T eA d = eA(t ) BB T eA(t ) d
0 0
(7.52)

es no singular para cualquier t > 0.


2. La matriz de controlabilidad de n n:

B AB A2 B An1 B (7.53)

tiene rango igual a n, es decir, su determinante es diferente de cero.


7.6 Controlabilidad y observabilidad 415

La razon de este resultado puede explicarse a grandes rasgos del siguiente


modo. La siguiente entrada:
T
u(t) = B T eA(t1 t) Wc1 (t1 )[eAt1 x0 x1 ] (7.54)

transfiere el estado del sistema desde x0 = x(0) en t0 = 0 hasta x1 en t1 > 0.


Esto se puede verificar sustituyendo en la solucion presentada en (7.46), pero
evaluada en t = t1 , es decir:
Z t1
x(t1 ) = eAt1 x(0) + eA(t1 ) Bu( )d
0

la entrada en (7.54), pero evaluada en t = , es decir:


T
u( ) = B T eA(t1 ) Wc1 (t1 )[eAt1 x0 x1 ]

para obtener:

x(t1 ) = eAt1 x(0)


Z t1 T
+ eA(t1 ) B B T eA(t1 ) Wc1 (t1 )[eAt1 x0 x1 ] d
0
At1
=e x(0)
Z t1 T
eA(t1 ) BB T eA(t1 ) d Wc1 (t1 )[eAt1 x0 x1 ]
| 0 {z }
Wc (t1 )
= x1

Notese que este resultado necesita que la matriz Wc (t) de n n definida


en (7.52) sea no singular (para que Wc1 (t1 ) exista), lo cual es cierto para
cualquier t1 = t > 0 si la ecuacion dinamica es controlable. El hecho de que
t1 sea cualquier instante positivo significa que el estado puede pasar de x0 a
x1 en cualquier intervalo de tiempo de duracion no cero.
Por otro lado, la igualdad en (7.52) se puede comprobar del siguiente modo.
Defnase v = t , entonces:
Z t T Z =t T
eA(t ) BB T eA(t ) d = eA(t ) BB T eA(t ) d
0 =0
Z v=0 T
= eAv BB T eAv (dv)
v=t
Z v=t T
= eAv BB T eAv dv
v=0

lo cual comprueba la igualdad en (7.52) si se usa en lugar de v en la ultima


integral, lo cual es valido porque el uso de v o de como variable de integracion
en la ultima integral no afecta el resultado.
416 7 La tecnica de las variables de estado

Finalmente, el hecho de que el rango n de la matriz en (7.53) sea una


condicion equivalente a la no singularidad de Wc (t) es de mucha utilidad
porque es mas facil verificar que (7.53) tenga rango n que la no singularidad
de Wc (t).

7.6.2. Observabilidad

Definicion 7.3 ([1], pag. 193) Una ecuacion dinamica es observable en el


instante t0 si existe un tiempo finito t1 > t0 tal que para cualquier estado
desconocido x0 en t = t0 , es suficiente el conocimiento de la entrada u y de la
salida y sobre el intervalo de tiempo [t0 , t1 ] para determinar de manera unica
el estado x0 . De otro modo la ecuacion dinamica es no observable.

Notese que la observabilidad es una propiedad que tiene que ver con la
posibilidad de conocer el estado (interno al sistema) a partir unicamente del
conocimiento de mediciones externas al sistema, es decir a partir de la entrada
y de la salida. Notese tambien que esta definicion es muy general pues tambien
considera la posibilidad de que la ecuacion de estado sea variante en el tiempo,
es decir, que los elementos de A, B y C sean funciones del tiempo. En el caso
de una ecuacion dinamica invariante en el tiempo como la mostrada en (7.50),
(7.51), es decir cuando los elementos de A, B y C son constantes, si la ecuacion
de estado es observable entonces lo es para cualquier t0 0 y el instante t1
es cualquier valor tal que t1 > t0 , es decir, la determinacion del estado inicial
puede ser conseguida en cualquier intervalo de tiempo de duracion no zero.
Esto permite obtener una manera muy simple de verificar si una ecuacion de
estado es observable:

Teorema 7.3 ([6], pag. 155,156) La ecuacion dinamica en (7.50), (7.51), es


observable si y solo si cualquiera de las dos siguientes condiciones equivalentes
se satisface:
1. La siguiente matriz de n n:
Z t
A T T A
Wo (t) = e C Ce d (7.55)
0

es no singular para cualquier t > 0.


2. La matriz de observabilidad de n n:

C
CA

CA2
(7.56)
..
.
CAn1

tiene rango igual a n, es decir, su determinante es diferente de cero.


7.6 Controlabilidad y observabilidad 417

La razon de este resultado puede explicarse a grandes rasgos del siguiente


modo. Considere la solucion dada en (7.48) y defina:

y(t) = CeAt x(0) (7.57)


Z t
= y(t) C eA(t ) Bu( )d (7.58)
0

Notese que de acuerdo a (7.58) la funcion y(t) se puede calcular a partir del
conocimiento exclusivo de la entrada y de la salida. Multiplicando ambos lados
T
de (7.57) por eAt C T e integrando sobre [0, t1 ] se obtiene:
Z t1 Z t1

At T T At
T
e C Ce dt x(0) = eAt C T y(t)dt
0 0
| {z }
Wo (t1 )

Si la matriz Wo (t1 ) es no singular, lo cual es cierto si el sistema es observable,


entonces el estado inicial x(0) = x0 se puede calcular de manera unica como:
Z t1 T
x0 = Wo1 (t1 ) eAt C T y(t)dt
0

Notese que este resultado necesita que la matriz Wo (t) de n n definida


en (7.55) sea no singular (para que Wo1 (t1 ) exista), lo cual es cierto para
cualquier t1 = t > 0 si la ecuacion dinamica es observable. El hecho de que t1
sea cualquier instante positivo significa que el estado x0 puede ser calculado
con la informacion obtenida desde la entrada y desde la salida en cualquier
intervalo de tiempo de duracion no cero.
Finalmente, el hecho de que el rango n de la matriz en (7.56) sea una
condicion equivalente a la no singularidad de Wo (t) es de mucha utilidad
porque es mas facil verificar que (7.56) tenga rango n que la no singularidad
de Wo (t).

Ejemplo 7.4 Una manera de estimar el estado actual x(t) (y no el estado


inicial x(0)) es utilizando mediciones de la salida y de la entrada as como
algunas de sus derivadas respecto al tiempo. A continuacion se muestra que
una condicion necesaria para este calculo es, de nuevo, que la matriz en (7.56)
tenga rango n. Considere la ecuacion dinamica en (7.50), (7.51). Las primeras
n 1 derivadas de la salida se obtienen como:

y = Cx,
y = C x = CAx + CBu,
y = CAx + CB u = CA2 x + CABu + CB u,
y (3) = CA2 x + CAB u + CB u = CA3 x + CA2 Bu + CAB u + CB u,
..
.
418 7 La tecnica de las variables de estado

y (i) = CAi x + CAi1 Bu + CAi2 B u + + CBu(i1) ,


..
.
y (n1) = CAn1 x + CAn2 Bu + CAn3 B u + + CBu(n2)

donde el exponente entre parentesis representa el orden de la derivada respecto


al tiempo. Acomodando matricialmente estas expresiones:

Y = Dx(t) + U

donde:

y C
y CA

y CA2
(3)
Y = y , D= CA3 ,

.. ..
. .
y (n1) CAn1

0
CBu

CABu + CB u

U = CA2 Bu + CAB u + CB u

..
.
CAn2 Bu + CAn3 B u + + CBu(n2)

Por tanto, si la matriz en (7.56) tiene rango n entonces la matriz D de n n


es invertible y el estado actual se puede calcular como:

x(t) = D1 (Y U ) (7.59)

es decir, utilizando unicamente mediciones de la salida y la entrada as como


algunas de las derivadas respecto al tiempo de estas variables. La gran desven-
taja de esta manera de calcular el valor del estado x(t) es que generalmente las
mediciones de cualquier variable estan contaminadas de ruido en la practica
y este problema es mas grave conforme se calculan derivadas de orden mayor
a partir de estas mediciones. Esta es la razon por la que (7.59) no se utiliza
para calcular el estado x(t) y se prefieren metodos como el presentado en la
seccion 7.11.

7.7. Funcion de transferencia de una ecuacion dinamica


Sea la siguiente ecuacion dinamica de una entrada-una salida:

x = Ax + Bu (7.60)
y = Cx
7.7 Funcion de transferencia de una ecuacion dinamica 419

donde x Rn , u R, y R son funciones del tiempo, A es una matriz


constante de n n, B es un vector columna constante de n componentes y C
es un vector renglon constante de n componentes. Aplicando la transformada
de Laplace a (7.60) se obtiene:

sX(s) x(0) = AX(s) + BU (s) (7.61)


Y (s) = CX(s) (7.62)

donde X(s), Y (s), U (s) representan, respectivamente, la transformada de La-


place del vector de estado x, de la salida escalar y y de la entrada escalar
u mientas que x(0) es el valor inicial del estado x. Recuerdese que dado un
vector x = [x1 , x2 , . . . , xn ]T que es funcion del tiempo, su transformada de
Laplace se obtiene aplicando esta operacion a cada elemento de dicho vector,
es decir [3], cap. 4:

L {x1 }
L {x2 }

X(s) = .
..
L {xn }

Una funcion de transferencia siempre se define bajo la suposicion de condicio-


nes iniciales cero. Sustituyendo x(0) = 0 en (7.61) y despejando X(s):

X(s) = (sI A)1 BU (s) (7.63)

donde I representa la matriz identidad de n n. Sustituyendo (7.63) en (7.62)


se obtiene:
Y (s)
= G(s) = C(sI A)1 B (7.64)
U (s)

Notese que la funcion de transferencia G(s) dada en (7.64) es un escalar. Ahora


se procede a analizar dicha funcion de transferencia. Con el fin de presentar
una exposicion mas clara de las ideas, a continuacion se supone que n = 3, es
decir que A es una matriz de 3 3, I es una matriz identidad de 3 3 y que
B y C son vectores columna y renglon, respectivamente, de 3 componentes:

a11 a12 a13 b1
A = a21 a22 a23 , B = b2 , C = c1 c2 c3
a31 a32 a33 b3

Sin embargo, el lector puede darse cuenta de que el mismo procedimiento es


valido para cualquier valor arbitrario de n. Primero calculese la matriz:

s a11 a12 a13
sI A = a21 s a22 a23
a31 a32 s a33
420 7 La tecnica de las variables de estado
Adj(sIA)
cuya matriz inversa esta dada de acuerdo a la formula (sI A)1 = det(sIA)
donde [2], cap. 10:
T
Cof11 Cof12 Cof13
Adj(sI A) = Cof T (sI A) = Cof21 Cof22 Cof23
Cof31 Cof32 Cof33

donde Cof (sI A) es la matriz de cofactores de sI A y Cofij = (1)i+j Mij


y Mij es el determinante de (n 1) (n 1), es decir de 2 2, que queda
al eliminar el renglon i y la columna j del determinante de la matriz sI A
[2], cap. 10. Calculando explcitamente estos elementos se puede observar que
Cofij es un polinomio de s cuyo grado es estrictamente menor que n = 3. Por
otro lado, desarrollando a traves del primer renglon se encuentra que:

s a22 a23 a21 a23
det(sI A) = (s a11 )
+ a12
a32 s a33 a31 s a33

a21 s a22
a13
a31 a32

es decir, det(sI A) es un polinomio de s de grado igual a n = 3. A partir de


estas observaciones se concluye que todos los elementos de la matriz:

Inv11 Inv12 Inv13
Adj(sI A)
(sI A)1 = = Inv21 Inv22 Inv23
det(sI A)
Inv31 Inv32 Inv33

estan dados como el cociente de dos polinomios de s de manera que el polino-


mio del numerador es de grado estrictamente menor que n = 3 y el polinomio
del denominador es, para todos los elementos de (sI A)1 , un polinomio de
grado n = 3 que esta dado como det(sI A).
Por otro lado, el producto (sI A)1 B es un vector columna de n = 3
componentes. Cada uno de estos componentes se obtiene como:

d1 Inv11 b1 + Inv12 b2 + Inv13 b3
(sI A)1 B = d2 = Inv21 b1 + Inv22 b2 + Inv23 b3
d3 Inv31 b1 + Inv32 b2 + Inv33 b3

De acuerdo a lo expuesto en el parrafo anterior sobre la manera en que esta da-


do cada uno de los elementos Invij de la matriz (sI A)1 y recurriendo a
la suma de fracciones con el mismo denominador, se concluye que cada uno
de los elementos di del vector columna (sI A)1 B tambien esta dado como
el cociente de dos polinomios de s de manera que el polinomio del numerador
tiene grado estrictamente menor que n = 3 mientras que el polinomio del
denominador es det(sI A) que tiene grado igual a n = 3. Finalmente, se
encuentra lo siguiente:

C(sI A)1 B = c1 d1 + c2 d2 + c3 d3
7.7 Funcion de transferencia de una ecuacion dinamica 421

Razonando de manera similar es posible concluir lo siguiente, lo cual es valido


para cualquier valor de n:
Resultado 7.11 ( [1], caps. 6, 7) La funcion de transferencia dada en (7.64)
es un escalar que esta dado como el cociente de dos polinomios de s de manera
que el polinomio del numerador tiene grado estrictamente menor que n y el
polinomio del denominador es igual a det(sI A) el cual tiene grado igual a
n, es decir:

Y (s) bm sm + bm1 sm1 + + b1 s + b0


= G(s) = C(sI A)1 B =
U (s) sn + an1 sn1 + + a1 s + a0
(7.65)
det(sI A) = sn + an1 sn1 + + a1 s + a0

para algunas constantes reales bk , al , k = 0, 1, . . . , m, l = 0, 1, . . . , n 1, con


n > m.
Sin embargo, para que esta afirmacion sea cierta es necesario incluir la
siguiente condicion adicional [1], cap 7:
Condicion 7.1 La ecuacion dinamica en (7.60) debe ser controlable, es decir,
el determinante de la matriz en (7.53) debe ser diferente de cero.
Si ademas se cumple lo siguiente, entonces los polinomios bm sm +bm1 sm1
+ + b1 s + b0 y sn + an1 sn1 + + a1 s + a0 no tienen races comunes [1],
cap 6:
Condicion 7.2 La ecuacion dinamica en (7.60) es observable, es decir, el
determinante de la matriz en (7.56) es diferente de cero.
Ejemplo 7.5 Con el fin de poner en practica estas ideas, a continuacion se
considera un caso sencillo: un motor de CD. En el captulo 9 se muestra que
el modelo de un motor de CD es el siguiente (vease (9.8)):

J + b = n km i (7.66)

cuando no existe perturbacion externa. Ademas, se puede considerar que la


corriente electrica i es la senal de entrada cuando se utiliza un lazo interno
de corriente de alta ganancia. Definiendo las variables de estado como la
posicion y la velocidad, no es difcil darse cuenta de que se obtiene la siguiente
ecuacion dinamica:

x = Ax + Bu, y = Cx (7.67)

x1 0 1 0
x= = , A= , B= nkm , u = i
x2 0 Jb J

donde C es un vector renglon que se definira mas adelante dependiendo de la


salida que se desee considerar. Notese que la siguiente matriz:
422 7 La tecnica de las variables de estado
nkm

0
B AB = J
nkm
J nkJm Jb
2
tiene rango n = 2 ya que su determinante es igual a nkJm 6= 0. A partir
de las definiciones en (7.67) se obtienen los siguientes resultados:

s 1 b
sI A = , det(sI A) = s s + ,
0 s + Jb J

s + Jb 0 s + Jb 1
Cof (sI A) = , Adj(sI A) = Cof T (sI A) = ,
1 s 0 s

Adj(sI A) 1 s + Jb 1
(sI A)1 = =
det(sI A) s(s + b ) J
0 s

Para obtener la funcion de transferencia correspondiente se consideraran los


siguientes dos casos:
La salida es la posicion, es deicr y = = x1 = Cx, donde C = [1 0].
Entonces:

1 s + Jb 1 0
G(s) = C(sI A)1 B = 1 0 nkm
s(s + b ) J
0 s J
nkm
J
G(s) =
s(s + Jb )

Notese que en este caso la siguiente matriz:



C 10
=
CA 01

tiene rango igual a n = 2 ya que su determinante es igual a la unidad, es


decir, es diferente de cero.
La salida es la velocidad, es decir y = = x2 = Cx, donde C = [0 1].
Entonces:

1
1 s + Jb 1 0
G(s) = C(sI A) B = 0 1 nkm
s(s + Jb ) 0 s J
nkm
J s
G(s) =
s(s + Jb )

En este caso la siguiente matriz:



C 0 1
=
CA 0 Jb

tiene rango menor que n = 2 ya que su determinante es igual a cero.


7.8 Funcion de transferencia y ecuacion dinamica 423

Notese que en ambos casos la funcion de transferencia obtenida cumple con lo


establecido en (7.65): que el polinomio del denominador es igual a det(sI A).
Notese tambien que esto es cierto gracias a que la matriz [B AB] tiene ran-
go igual a n = 2 en ambos casos. Finalmente, se puede apreciar el efecto de
que el sistema sea o no observable: en el segundo de los casos el sistema no
es observable y por ello la funcion de transferencia correspondiente tiene un
polo y un cero que se cancelan lo cual no ocurre en el primero de los casos
porque es observable. Dicha cancelacion polo-cero en el segundo de los casos
trae como consecuencia que la funcion de transferencia sea de primer orden
lo cual significa que solo uno de los estados (la velocidad) es descrito por la
correspondiente funcion de transferencia. Es decir, la posicion del motor no
tiene ningun efecto cuando se trata de controlar la velocidad del motor. De
esta manera se puede dar una nueva interpretacion a la observabilidad, co-
mo se explica a continuacion. Cuando la salida es la posicion, el sistema es
observable porque conociendo la posicion se puede calcular la velocidad (que
es la otra variable de estado) derivando la posicion, por ejemplo. Pero si la
salida es la velocidad el conocimiento de esta variable no es suficiente para
conocer la posicion (que es la otra variable de estado) como se explica a conti-
nuacion. Aunque se podra argumentar que la posicion (t) se puede calcular
simplemente integrando la velocidad sin embargo, de acuerdo a:
Z t
(t) (0) = (r)dr
0

ademas de conocer la velocidad es necesario conocer la posicion inicial (0) la


cual es desconocida. Por esto, el sistema no es observable cuando la velocidad
es la salida. Sin embargo, como ya se menciono, si lo unico que se desea es
controlar la velocidad esto no trae ningun problema porque para eso no se
necesita conocer la posicion. As que la observabilidad es importante en otro
tipo de problemas que se abordaran mas adelante (secciones 7.11 y 7.12).
Finalmente, el lector puede comprobar la exactitud de estos resultados com-
parando estas funciones de transferencia con las obtenidas en los captulos 9
y 10.

7.8. Una de las ecuaciones dinamicas que corresponden


a una funcion de transferencia
Una de las caractersticas de la representacion en variables de estado es que
no es unica. Es decir, dado un mismo sistema fsico existen muchas ecuaciones
dinamicas que lo representan correctamente. Esto significa tambien que dada
una funcion de transferencia existen muchas ecuaciones dinamicas que la re-
presentan correctamente. A continuacion se muestra la manera de obtener una
de esas ecuaciones dinamicas. Considere la siguiente funcion de transferencia:
Y (s) bm sm + bm1 sm1 + + b1 s + b0
= G(s) = (7.68)
U (s) sn + an1 sn1 + + a1 s + a0
424 7 La tecnica de las variables de estado

Despejese la salida:
bm sm + bm1 sm1 + + b1 s + b0
Y (s) = U (s)
sn + an1 sn1 + + a1 s + a0
Defnase la nueva variable:
1
V (s) = U (s) (7.69)
sn + an1 sn1 + + a1 s + a0
para escribir:
Y (s) = (bm sm + bm1 sm1 + + b1 s + b0 )V (s) (7.70)
Considere la expresion (7.69). Pasando el denominador multiplicando al la-
do izquierdo, aplicando la transformada inversa de Laplace y despejando la
derivada de mayor orden se obtiene:
v (n) = an1 v (n1) a1 v a0 v + u (7.71)
donde V (s) = L {v}. De acuerdo a lo expuesto en la seccion 7.1, defnanse las
variables de estado como la incognita de la ecuacion diferencial (7.71), v, y
sus primeras n 1 derivadas:
x1 = v, x2 = v, x3 = v, ..., xn = v (n1) (7.72)
Entonces, (7.71) se puede escribir como:
x n = an1 xn a1 x2 a0 x1 + u (7.73)
Por otro lado, aplicando la transformada inversa de Laplace a (7.70) se obtiene:
y = bm v (m) + bm1 v (m1) + + b1 v + b0 v
Si se considera que m toma su valor maximo, es decir m = n 1 (recuerdese
que n > m) entonces puede usarse (7.72) para escribir:
y = bn1 xn + bn2 xn1 + + b1 x2 + b0 x1 (7.74)
Usando (7.72), (7.73) y (7.74) se obtiene:
x = Ax + Bu (7.75)
y = C x

0 1 0 0 0 0 0
0 0 1 0 0 0 0

0 0 0 1 0 0 0

0 0 0 0 0 0
A = , B = 0 ,
.. .. .. .. .. .. .. ..
. . . . . . . .

0 0 0 0 0 1 0
a0 a1 a2 a3 an2 an1 1

C = b0 b1 b2 b3 bn2 bn1 ,
T
x = x1 x2 x3 x4 xn1 xn
7.9 Ecuaciones dinamicas equivalentes 425

La expresion (7.75) representa una ecuacion dinamica que corresponde a la


funcion de transferencia dada en (7.68) y se dice que esta en la forma canonica
de controlabilidad. Como se vera mas adelante la forma canonica de controla-
bilidad es muy util para disenar un controlador por realimentacion del estado.

7.9. Ecuaciones dinamicas equivalentes

En la seccion 7.7 se ha mostrado a que cualquier ecuacion dinamica de una


entrada y una salida que sea controlable y que cuya forma sea la mostrada en
(7.60) le corresponde una funcion de transferencia de la forma presentada en
(7.65). Notese que el requisito de la observabilidad solo sirve para asegurar que
no hay cancelaciones de polos y ceros en la funcion de transferencia (7.65).
Por otro lado, en la seccion 7.8 se ha mostrado que cualquier funcion de
transferencia de la forma (7.65) puede escribirse en la forma de la ecuacion
dinamica mostrada en (7.75). Esto significa que cada una de las ecuaciones
dinamicas en (7.60) y (7.75) puede ser obtenida a partir de la otra, es decir,
que ambas son equivalentes.
A continuacion se muestra como pasar de (7.60) a (7.75), y viceversa, sin
necesidad del paso intermedio de una funcion de transferencia. Considere la
ecuacion dinamica (7.60) de una entrada y una salida y defina la siguiente
transformacion lineal:

x = P x (7.76)

donde P es una matriz constante de n n que se define a partir de su inversa


como se indica a continuacion [1], cap. 7:

P 1 = q1 qn2 qn1 qn , (7.77)
qn = B,
qn1 = AB + an1 B,
qn2 = A2 B + an1 AB + an2 B,
..
.
q1 = An1 B + an1 An2 B + + a1 B
det(sI A) = sn + an1 sn1 + + a1 s + a0

Es importante subrayar que la matriz P 1 es invertible, es decir, su inversa


P siempre existe si la matriz definida en (7.53) tiene rango n [1], cap. 7, es
decir si (7.60) es controlable. Esto puede explicarse del siguiente modo. Si
la matriz definida en (7.53) tiene rango n, es decir todas sus columnas son
linealmente independientes, entonces cuando sus columnas se suman como en
las expresiones anteriores que definen a los vectores q1 , . . . , qn2 , qn1 , qn , las
columnas q1 , . . . , qn2 , qn1 , qn resultan ser linealmente independientes. Esto
426 7 La tecnica de las variables de estado

significa que el determinante de P 1 es diferente de cero y, por tanto, su


inversa P existe. Usando (7.76) en (7.60), es decir x = P x, se obtiene:
x = Ax + Bu
y = C x
A = P AP 1 , B = P B, C = CP 1 (7.78)
La matriz A y los vectores B, C en (7.78) estan dados como en la forma
canonica de controlabilidad (7.75) sin importar la forma que tengan A, B y
C mientras la matriz definida en (7.53) tenga rango n. La demostracion de
esta ultima afirmacion requiere de herramientas matematicas que estan fuera
del alcance de este libro y por ello no se presenta. Se recomienda consultar la
referencia [1] para una solucion completa de este problema. El lector puede
verificar estas ideas proponiendo valores numericos para las matrices A, B, C
y realizando los calculos correspondientes. Esto significa que cada una de las
ecuaciones dinamicas (7.60) y (7.75) puede ser obtenida a partir de la otra y
que la relacion entre las matrices involucradas esta dada por (7.78), es decir,
que ambas son equivalentes. Notese que la condicion fundamental para que
exista esta equivalencia es que la matriz definida en (7.53) tenga rango n [1],
cap 5. Esto se resume del siguiente modo:
Teorema 7.4 ([1], cap. 7) Si (7.60) es controlable, entonces esta ecuacion
dinamica es equivalente a (7.75) mediante la transformacion lineal (7.76),
(7.77), es decir, a traves de (7.78).
Ejemplo 7.6 En el captulo 13 se obtiene la aproximacion lineal de un me-
canismo conocido como el pendulo de Furuta. Este modelo se presenta en
(13.13), (13.14), y a continuacion se reescribe para facilitar la referencia:
z = Az + Bv (7.79)

01 0 0 0
0 0 gm21 l12 L0 J1 +m1 l12
I0 (J1 +m1 l12 )+J1 m1 L20
0

2 2
k
m
A= , B = I0 (J1 +m1 l1 )+J1 m1 L0
0 0 0 1 0 ra
(I0 +m1 L20 )m1 l1 g m1 l1 L0
0 0 I0 (J1 +m1 l2 )+J1 m1 L2 0 I0 (J1 +m1 l12 )+J1 m1 L20
1 0

Para facilitar la manipulacion algebraica se definen las siguientes constantes:


gm21 l12 L0 (I0 + m1 L20 )m1 l1 g
a= 2 2 , b=
I0 (J1 + m1 l1 ) + J1 m1 L0 I0 (J1 + m1 l12 ) + J1 m1 L20
J1 + m1 l12 km m1 l1 L0 km
c= 2 2 , d= 2 2
I0 (J1 + m1 l1 ) + J1 m1 L0 ra I0 (J1 + m1 l1 ) + J1 m1 L0 ra
La siguiente matriz tiene la forma:

0 c 0 ad
c 0 ad 0
Co = B AB A2 B A3 B =
0

d 0 bd
d 0 bd 0
7.9 Ecuaciones dinamicas equivalentes 427

Despues de un desarrollo algebraico sencillo, aunque laborioso, se obtiene:


m41 l14 L20 g 2 4
km
det(Co ) = 2 2 6= 0 (7.80)
[I0 (J1 + m1 l1 ) + J1 m1 L0 ] ra4
4

Por tanto, la ecuacion dinamica en (7.79) es controlable para cualquier con-


junto de parametros del pendulo de Furuta. Es decir, este resultado no cambia
si el mecanismo con el que se cuenta es grande o pequeno o si es ligero o pe-
sado. Esto significa que la matriz P introducida en (7.76) es no singular y a
continuacion es construida utilizando la formula presentada en (7.77). Para
simplificar los calculos se utilizaran los siguientes valores numericos:
2 2 2
I0 = 1.137 103 [kgm ], J1 = 0.38672 103 [kgm ], g = 9.81[m/s ]
km
l1 = 0.1875[m], m1 = 0.033[kg], L0 = 0.235[m], = 0.0215[Nm/V]
ra
que corresponden a los parametros del pendulo de Furuta que es construido y
controlado en el captulo 13. Con estos valores se encuentra:

01 0 0 0
0 0 35.81 0
A= , B = 13.4684
0 0 0 1 0
0 0 72.90 0 12.6603
Con estos datos, y calculando numericamente, se encuentra que las races del
polinomio det(I A) son:

1 = 0, 2 = 0, 3 = 8.5381, 4 = 8.5381

Entonces se realiza el producto:

( 1 )( 2 )( 3 )( 4 ) = 4 + a3 3 + a2 2 + a1 + a0

de donde se encuentra, al igualar coeficientes:

a3 = 0, a2 = 72.8992, a1 = 0, a0 = 0 (7.81)

Usando estos valores en (7.77) se encuentra:



527.8686 0 13.4600 0
0 527.8686 0 13.4600
P 1 = 0.0101


0 12.6600 0
0 0.0101 0 12.6600
y, por tanto:

0.0019 0 0.0020 0
0 0.0019 0 0.0020
P =
0.0000

(7.82)
0 0.0790 0
0 0.0000 0 0.0790
428 7 La tecnica de las variables de estado

Finalmente, con el fin de comprobar las expresiones en (7.78) se realizan los


siguientes productos:

0 1.0000 0 0 0
0.0008 0 1.0000 0
P AP 1 = , PB = 0
0 0 0 1.0000 0
0.0583 0 72.8992 0 1

Notese que, una vez que se identifican y eliminan algunos errores numericos,
estas matrices tienen exactamente la forma presentada en (7.75) para A =
P AP 1 y B = P B.

7.10. Control por realimentacion del estado

Considere la ecuacion de estado de una entrada una salida presentada en


(7.60) en lazo cerrado con el siguiente controlador:

u = Kx = (k1 x1 + k2 x2 + . . . + kn xn ) (7.83)

K = k1 k2 . . . kn

donde ki , i = 1, . . . , n, son n escalares constantes. Sustituyendo (7.83) en


(7.60) se obtiene:

x = (A BK)x (7.84)

Al igual que (7.49), la ecuacion dinamica en (7.84) no tiene entrada. Por tanto,
el criterio de estabilidad establecido para (7.49) es aplicable a (7.84). Esto sig-
nifica que el vector x(t) solucion de (7.84) satisface lmt x(t) = 0 si y solo
si todos los eigenvalores de la matriz A BK tienen parte real estrictamente
negativa. Sin embargo, desde el punto de vista de una aplicacion practica esto
no es suficiente debido a que, ademas, se requiere un buen desempeno del
sistema en lazo cerrado. Es importante subrayar que la forma de la respuesta
x(t) de la ecuacion en (7.84) depende de la ubicacion de los eigenvalores de
A BK. Por tanto, los eigenvalores de la matriz A BK deben poder ser
asignados en donde se desee. Esto se indica diciendo que tales eigenvalores de-
ben poder ser asignados arbitrariamente. Dado que el vector renglon K puede
seleccionarse a voluntad, es de interes saber como seleccionar K de manera
que los eigenvalores de A BK queden asignados en donde se especifique. A
continuacion se presenta la solucion a este problema.
Considere la transformacion lineal (7.76), (7.77) y sustituyala en (7.84)
para obtener:

x = Ax B K x (7.85)
K = KP 1
7.10 Control por realimentacion del estado 429

con A y B dados como en (7.78) y (7.75). Notese que K x es un escalar dado


como:

K x = k1 x1 + k2 x2 + . . . + kn xn ,

K = k1 k2 . . . kn

que, de acuerdo a (7.75), solo afecta el ultimo renglon de (7.85) la cual, por
tanto, puede escribirse como:

x = (A B K)x,
A B K =

0 1 0 0 0 0
0 0 1 0 0 0

0 0 0 1 0 0

0 0 0 0 0 0

.. .. .. .. .. .. ..
. . . . . . .

0 0 0 0 0 1
k1 a0 k2 a1 k3 a2 k4 a3 kn1 an2 kn an1

Entonces, si se selecciona:

K = a0 a0 a1 a1 . . . an1 an1 (7.86)

se consigue:

0 1 0 0 0 0
0 0 1 0 0 0

0 0 0 1 0 0

0 0 0 0 0 0
A B K =
.. .. .. .. .. .. ..
. . . . . . .

0 0 0 0 0 1
a0 a1 a2 a3 an2 an1

Notese que de acuerdo a (7.78) y (7.85) se puede escribir:

A B K = P AP 1 P BKP 1 = P (A BK)P 1 (7.87)

Es decir, las matrices A B K y A BK satisfacen (7.38) por lo que ambas


tienen los mismos eigenvalores. De acuerdo a lo visto en las secciones previas,
los eigenvalores de A B K satisfacen:

det(I [A B K]) = n + an1 n1 + + a1 + a0


Yn
= ( i )
i=1
430 7 La tecnica de las variables de estado

donde i , i = 1, . . . , n son los eigenvalores deseados y se proponen a voluntad


del disenador. Debe tenerse el cuidado de que todos los eigenvalores deseados
complejos aparezcan con sus parejas conjugadas para asegurar que todos los
coeficientes ai , i = 0, 1, . . . , n 1 sean reales lo cual, a su vez, asegura que las
ganancias K y K sean reales. A continuacion se resume el procedimiento [1],
cap. 7, para calcular el vector de ganancias K que asigne los eigenvalores que
se deseen a la matriz de lazo cerrado A BK.
Encuentre el polinomio:

det(I A) = n + an1 n1 + + a1 + a0

Proponga los eigenvalores deseados en lazo cerrado 1 , 2 , . . . , n . Si algu-


no de estos eigenvalores es complejo entonces tambien debe proponerse su
pareja conjugada como uno de los eigenvalores deseados.
Calcule:
n
Y
( i ) = n + an1 n1 + + a1 + a0
i=1

Calcule:

K = a0 a0 a1 a1 . . . an1 an1

Calcule los vectores q1 , . . . , qn2 , qn1 , qn de acuerdo a (7.77), obtenga la


matriz P 1 definida en dicha expresion y encuentre su matriz inversa P .
Calcule la matriz de ganancias del controlador en (7.83) como K = KP .
Ejemplo 7.7 Continuando con el ejemplo 7.6, donde se aborda el estudio del
pendulo de Furuta, ahora se desea encontrar el vector de ganancias K que, al
ser utilizado en el controlador (7.83) (con x = z), asigne en:

1 = 94, 2 = 18, 3 = 0.5, 4 = 1

a los eigenvalores de la matriz A BK. Para esto, utilizando los valores


anteriores se forma el siguiente polinomio:

( 1 )( 2 )( 3 )( 4 ) = 4 + a3 3 + a2 2 + a1 + a0

de donde se encuentra, al igualar coeficientes:

a3 = 113.5, a2 = 1860.5, a1 = 2594, a0 = 846

Con estos valores y los obtenidos en (7.81) se calcula el vector K de acuerdo


a(7.86):

K = 846 2594 1933.3 113.5

Finalmente, usando estos valores y la matriz P mostrada en (7.82) se calcula


el vector de ganancias K de acuerdo a K = KP :
7.11 Observadores de estado 431

K = 1.5997 4.9138 154.4179 14.1895

el cual, a excepcion de algunos errores de redondeo, es el vector de ganancias


utilizado para controlar experimentalmente el pendulo de Furuta en el captulo
13.

7.11. Observadores de estado


Como se indico en la seccion 7.1, el estado x esta constituido por variables
que son internas al sistema y, por tanto, en general no se conocen y no se
pueden medir. En cambio, la salida y representa una variable que siempre se
puede medir. Esto significa que la construccion practica de un controlador de
la forma (7.83) puede ser no posible si no se puede medir todo el estado. Por
esta razon es importante contar con una variable x b(t) que sea el estimado del
estado x(t), el cual pueda ser utilizado para construir un controlador de la
forma:

u = K x
b = (k1 x b1 + k2 x
b2 + . . . + kn xbn ) (7.88)
T
K = k1 k2 . . . kn , xb= x b1 x
b2 . . . x
bn

El mecanismo que se utiliza para calcular el estimado x b recibe el nombre de


observador de estado o simplemente observador. Un observador debe cal-
cular x
b exclusivamente a partir de informacion que pueda ser medida, es decir
usando la entrada y la salida exclusivamente. Por otro lado, si el controlador
(7.88) ha de sustituir al controlador en (7.83), entonces una propiedad funda-
mental que debe satisfacer el observador a construir es que debe producir un
estimado xb que converja lo mas rapido posible al valor real de x, o al menos
que lo haga de manera sintotica, es decir, que se asegure que:

lm x
b(t) = x(t)
t

Un observador que cumple con esta caracterstica es el siguiente:

x
b = (A LC)b
x + Ly + Bu (7.89)

donde L = [L1 , L2 , . . . , Ln ]T es un vector columna constante. Esto puede


explicarse del siguiente modo. Defnase el error de estimacion como x = x x
b.
Entonces, restando (7.89) a (7.60) se obtiene:

x = Ax (A LC)b
x Ly

Usando y = Cx en esta expresion:

x = Ax LC x
= (A LC)x
432 7 La tecnica de las variables de estado

Por tanto, usando los resultados de la seccion 7.5 se concluye que lmt x(t) =
0 y, por tanto, lmt x
b(t) = x(t) si y solo si todos los eigenvalores de la ma-
triz ALC tienen parte real estrictamente negativa. As que el unico problema
que resta es como seleccionar el vector (columna) de ganancias L de manera
que todos los eigenvalores de la matriz ALC tengan parte real estrictamente
negativa. Este problema queda resuelto del siguiente modo:
Teorema 7.5 ([1], pag. 358) Si la ecuacion dinamica en (7.60) es observable,
entonces su estado puede ser estimado usando el observador en (7.89) y todos
los eigenvalores de la matriz A LC pueden ser asignados arbitrariamente
previendo que los eigenvalores complejos aparecen con sus parejas conjugadas.
Para explicar esta afirmacion es de mucha utilidad el siguiente resultado:
Teorema 7.6 ([1], pag. 195) Considere las dos ecuaciones dinamicas siguien-
tes:
x = Ax + Bu (7.90)
y = Cx

z = AT z + C T u (7.91)
T
=B z
donde u, y, R, mientras que x, z Rn . La ecuacion en (7.90) es controlable
(observable) si y solo si la ecuacion en (7.91) es observable (controlable).
Por tanto, volviendo al problema del observador, como el par (A, C) es
observable entonces el par (AT , C T ) y, por tanto, el par (AT , C T ) son con-
trolables (porque el signo de la matriz AT no afecta la independencia
lineal de las columnas de la matriz en (7.53), vease la seccion 7.3). A partir de
esto se concluye que, siguiendo el procedimiento presentado en la seccion 7.10,
siempre se puede encontrar un vector renglon K constante tal que la matriz
AT C T K posee cualquier conjunto de eigenvalores deseados (eigenvalores
arbitrarios). Como los eigenvalores de una matriz son iguales a los eigenvalores
de su matriz transpuesta (vease la seccion 7.3), entonces la matriz A K T C
tiene los mismos eigenvalores que la matriz AT C T K (los eigenvalores de-
seados). Definiendo L = K T se obtiene el vector columna de ganancias que se
necesita para disenar el observador en (7.89).
Cabe aclarar que la idea de que todos los eigenvalores de la matriz A LC
puedan ser asignados arbitrariamente significa que puedan ser colocados don-
de se desee segun el criterio del disenador. Obviamente todos los eigenvalores
deben tener parte real estrictamente negativa pero, ademas, se debe buscar
que esten colocados en lugares del plano complejo que aseguren una rapida
convergencia de x b(t) a x(t). Para decidir donde se deben colocar los eigenvalo-
res de la matriz A LC, son de mucha utilidad los conceptos sobre respuesta
transitoria que se estudiaron en el captulo 3 respecto de la ubicacion de los
polos de funciones de transferencia como la presentada en (7.65).
7.12 El principio de separacion 433

7.12. El principio de separacion


Cuando se tiene una ecuacion dinamica (planta):

x = Ax + Bu (7.92)
y = Cx

y un observador:

x
b = (A LC)b
x + Ly + Bu (7.93)

y se utiliza el siguiente controlador para unirlos (vease la figura 7.5):

u = K x
b = (k1 x
b1 + k2 x
b2 + . . . + kn x
bn ) (7.94)

surge la pregunta de como se vera afectada la estabilidad del sistema en lazo


cerrado (7.92), (7.93), (7.94), es decir es importante asegurar que se aun se
cumple que lmt x b(t) = x(t) y que lmt x(t) = 0.
La respuesta a esta pregunta se conoce como el principio de separacion
el cual establece lo siguiente:
Resultado 7.12 ([1], pag. 367) Los eigenvalores del sistema en lazo cerrado
(7.92), (7.93), (7.94), son la union de los eigenvalores de las matrices ABK
y A LC.
Esto significa que los eigenvalores del observador no son afectados por
la realimentacion en (7.94) y que, al menos en cuanto a los eigenvalores se
refiere, no hay diferencia entre realimentar el estimado x b(t) o el estado real
x(t). Sin embargo, se debe prevenir al lector sobre el hecho de que la respuesta
transitoria del sistema generalmente es diferente si se usa x(t) o si se usa
x
b(t) para construir la entrada. Lo importante es que se sigue cumpliendo que
lmt xb(t) = x(t) y lmt x(t) = 0. Por tanto, el diseno de las ganancias
K del controlador y el diseno de las ganancias L del observador pueden ser
realizados de manera independiente.
Ejemplo 7.8 Considere el motor de CD visto en el ejemplo 7.5, es decir,
considere la ecuacion dinamica:

x = Ax + Bu, y = Cx (7.95)

x1 0 1 0
x= = , A= , B= nkm , C = [1 0], u = i
x2 0 Jb J

donde se considera que la salida es la posicion mientras que la velocidad no


se puede medir y, por tanto, debera ser estimada usando un observador de
estado. Suponga que se desea controlar el motor para que alcance una posicion
constante, es decir, los valores deseados de posicion y de velocidad son:

x1d = d , x2d = 0
434 7 La tecnica de las variables de estado

u y
planta

observador

c
x
K

Figura 7.5. Sistema realimentado usando un observador para estimar el estado.

donde d es una constante que representa la posicion deseada y la velocidad


deseada es cero porque la posicion deseada es constante. Definiendo las varia-
bles de estado:

x1 = x1 x1d , x2 = x2

y calculando x 1 = x1 x1d = x2 = x2 y x 2 = x2 = se obtiene la ecuacion


dinamica:

x = Ax + Bu, (7.96)
= C x

donde es la nueva salida y la matriz A y los vectores B y C estan definidos


como en (7.95). Notese que la salida medida ahora es el error de posicion
= x1 . A partir de este momento se consideraran los valores numericos del
motor controlado en el captulo 10, es decir:
nkm b
k= = 675.4471, a= = 2.8681 (7.97)
J J
A continuacion se muestra como disenar el observador de estado correspon-
diente. En el ejemplo 7.5 se mostro que la ecuacion dinamica en (7.95) es
observable y, por tanto, tambien la ecuacion dinamica en (7.96). De acuerdo
al teorema 7.6, esto implica que los pares (AT , C T ) y (AT , C T ) son contro-
lables, es decir, que las siguientes matrices tienen rango n = 2:
T T T T
C AT C T , C A C

porque el signo que acompana a la matriz A no afecta la independencia


lineal de estas columnas (vease la seccion 7.3). Con los valores numericos en
(7.97) se calculan las rces del polinomio det(I AT ):
7.12 El principio de separacion 435

1 = 0, 2 = 2.8681

Entonces se realiza el producto:

( 1 )( 2 ) = 2 + a1 + a0

de donde se encuentra, al igualar coeficientes:

a1 = 2.8681, a0 = 0 (7.98)

Usando B = C T y AT en lugar de A, la formula en (7.77) se convierte en:



P 1 = q1 q2 ,
q2 = C T ,
q1 = AT C T + a1 C T ,

Usando los valores numericos en (7.97) y (7.98), as como la matriz A y el


vector C definidos en (7.95) se obtiene:

2.8681 1.0000
P 1 =
1.0000 0

y, por tanto:

0 1.0000
P = (7.99)
1.0000 2.8681

Suponga que se desea asignar los siguientes eigenvalores para la matriz ALC:

1 = 150, 2 = 100 (7.100)

Para esto se forma el siguiente polinomio:

( 1 )( 2 ) = 2 + a1 + a0

de donde se encuentra, al igualar coeficientes:

a1 = 250, a0 = 15000

Con estos valores y los obtenidos en (7.98) se calcula el vector K de acuerdo


a (7.86):

K = 15000 247

Usando estos valores y la matriz P mostrada en (7.99) se calcula el vector K,


de acuerdo a K = KP , y se asigna L = K T :

247
L= (7.101)
14291
436 7 La tecnica de las variables de estado

Por otro lado, siguiendo un procedimiento similar al de los ejemplos 7.13.1 y


7.13.2 se encuentra que el vector de ganancias:

K = 1.6889 0.0414 (7.102)

asigna en:

15.4 + 30.06j, 15.4 30.06j (7.103)

a los eigenvalores de la matriz ABK. Notese que los valores de las ganancias
en (7.102) son iguales a las ganancias proporcional y de realimentacion de ve-
locidad en el controlador disenado y probado experimentalmente en la seccion
10.2.1 del captulo 10, en donde los polos de lazo cerrado se asignan en los
valores indicados en (7.103). Finalmente, debe aclararse que el observador a
construir es:

z = (A LC)z + L + Bu (7.104)

donde z = [z1 z2 ]T es el estimado del vector x = [x1 x2 ]T y u = i . Mientras


que el controlador es:

z
u = K 1 (7.105)
z2

donde L y K toman los valores indicados en (7.101) y (7.102). Notese que el


controlador debe utilizar z1 , es decir el estimado de x1 , a pesar de que x1 es
una variable que se conoce por medicion. Esto es debido a que toda la teora
vista hasta aqu supone que es todo el estado estimado el que se realimenta. En
este sentido es conveniente aclarar que tambien existen observadores llamados
de orden reducido, los cuales solo estiman una parte del estado si la otra parte
es conocida. Al lector interesado en este tema se le recomienda consultar la
referencia [1].
En la figura 7.6 se muestran resultados en simulacion cuando se utiliza el
observador en (7.104) y la realimentacion en (7.105) junto con las ganancias
en (7.101) y (7.102) para controlar el motor cuyos parametros se muestran en
(7.97). La posicion deseada es d = 2, las condiciones iniciales de observador
son z(0) = [0 0]T , mientras que (0) = 0 (es decir, x1 (0) = 2) y (0) = 2.
Observese como los estimados z1 y z2 convergen asintoticamente a los valores
reales x1 y x2 . Es interesante darse cuenta de que esta convergencia es con-
seguida antes de que el motor termine de responder. Esto se ha conseguido
gracias a que los eigenvalores seleccionados para la matriz A LC (mostrados
en (7.100)) son mucho mas rapidos que los eigenvalores asignados a la matriz
A BK (mostrados en (7.103)). Este es el criterio que normalmente se debe
utilizar para asignar los eigenvalores del observador.
7.12 El principio de separacion 437

[rad]
2,5 x1

x 1d
1,5

0,5

0
0 0,1 0,2 0,3 0,4

t [ s]
(a) Posicion del motor
[rad]
0,5

-0,5

-1

z1
-1,5

f
x1
-2
0 0,1 0,2 0,3 0,4

t [ s]
(b) Error de posicion x1 y su estimado z1 .
[rad=s] 60
x2
40

20

-20

-40

z2
-60

0 0,1 0,2 0,3 0,4

t [ s]
(c) Velocidad del motor x2 y su estimado z2 .

Figura 7.6. Simulaciones. Uso del observador en (7.104) para controlar un motor
de CD.
438 7 La tecnica de las variables de estado

7.13. Caso de estudio. El pendulo con rueda inercial


7.13.1. Obtencion de la forma en (7.75)

En el captulo 14 se obtiene la aproximacion lineal de un mecanismo cono-


cido como el pendulo con rueda inercial. Este modelo se presenta en (14.32),
(14.35), y a continuacion se reescribe para facilitar la referencia:

z = Az + Bw, (7.106)

0 1 0 0
km
A = d11 mg 0 0, B = d12
R
d21 mg 0 0 d22

Para simplificar la manipulacion algebraica se definen las siguientes constan-


tes:

a = d11 mg, b = d21 mg


km km
c = d12 , d = d22
R R
La siguiente matriz tiene la forma:

0c 0

Co = B AB A2 B = c 0 ac
d 0 bc

Despues de un desarrollo algebraico sencillo se obtiene:


3
2 km
det(Co ) = (d12 ) mg(d11 d22 d12 d21 ) 6= 0 (7.107)
R

debido a que d11 d22 d12 d21 6= 0 es una propiedad del mecanismo, tal co-
mo se explica en el captulo 14. Por tanto, la ecuacion dinamica en (7.106)
es controlable para cualquier conjunto de parametros del pendulo con rueda
inercial. Es decir, este resultado no cambia si el mecanismo con el que se cuen-
ta es grande o pequeno o si es ligero o pesado. Esto significa que la matriz P
introducida en (7.76) es no singular y a continuacion es construida utilizando
la formula presentada en (7.77). Para simplificar los calculos se utilizaran los
siguientes valores numericos:

d11 = 0.0014636, d12 = 0.0000076,


d21 = 0.0000076, d22 = 0.0000076,
mg = 0.12597

donde:

d d 1 d22 d12
D 1
= 11 12 =
d21 d22 d11 d22 d12 d21 d21 d11
7.13 Caso de estudio. El pendulo con rueda inercial 439

que corresponden a los parametros del pendulo con rueda inercial que es cons-
truido y controlado en el captulo 14. Con estos valores se encuentra:

0 1.0000 0 0
A = 86.5179 0 0 , B = 1.2758
86.5179 0 0 245.6998

Con estos datos, y calculando numericamente, se encuentra que las races del
polinomio det(I A) son:

1 = 0, 2 = 9.3015, 3 = 9.3015

Entonces se realiza el producto:

( 1 )( 2 )( 3 ) = 3 + a2 2 + a1 + a0

de donde se encuentra, al igualar coeficientes:

a2 = 0, a1 = 86.5179, a0 = 0 (7.108)

Usando estos valores en (7.77) se encuentra:



0 1.275 0
P 1 = 5.467 105 0 1.275
21147.049 0 245.6998

y, por tanto:

0 910.6662 4.7287
P = 105 78379.7677 0 0 (7.109)
0 78379.8067 0.0002

Finalmente, con el fin de comprobar las expresiones en (7.78) se realizan los


siguientes productos:

0 1.0000 0 0
P AP 1 = 0.0000 0 1.0000 , P B = 0
0 86.5179 0 1

Notese que estas matrices tienen exactamente la forma presentada en (7.75)


para A = P AP 1 y B = P B.

7.13.2. Control por realimentacion del estado

Ahora se desea encontrar el vector de ganancias K que, al ser utilizado en


el controlador (7.83) (con x = z y u = w), asigne en:

1 = 5.8535 + 17.7192j, 2 = 5.8535 17.7192j, 3 = 0.5268


440 7 La tecnica de las variables de estado

a los eigenvalores de la matriz A BK. Para esto, utilizando los valores


anteriores se forma el siguiente polinomio:

( 1 )( 2 )( 3 ) = 3 + a2 2 + a1 + a0

de donde se encuentra, al igualar coeficientes:

a2 = 12.2338, a1 = 354.4008, a0 = 183.4494

Con estos valores y los obtenidos en (7.108) se calcula el vector K de acuerdo


a (7.86):

K = 183.44 440.91 12.23

Finalmente, usando estos valores y la matriz P mostrada en (7.109) se calcula


el vector de ganancias K de acuerdo a K = KP :

K = 345.5910 11.2594 0.0086

el cual, a excepcion de algunos errores de redondeo, es el vector de ganancias


utilizado para controlar experimentalmente el pendulo con rueda inercial en
el captulo 14.

7.14. Resumen del captulo

La tecnica de las variables de estado constituye la primera herramienta de


lo que hoy se conoce como control moderno. La manera de trabajar los proble-
mas en este enfoque es representando los modelos utilizando un conjunto de
ecuaciones diferenciales de primer orden que deben ser resueltas simultanea-
mente. Por tanto, el estudio se realiza de acuerdo a la respuesta en el tiempo y
se abandona el uso de la transformada de Laplace. Esta ultima caracterstica
es fundamental para permitir el estudio de sistemas no lineales, es decir, aque-
llos representados por ecuaciones diferenciales no lineales (vease el captulo
14 para un ejemplo de tales aplicaciones). Recuerdese que la transformada
de Laplace no se puede utilizar cuando se tienen ecuaciones diferenciales no
lineales.
Aunque existe una equivalencia entre la representacion en variables de
estado y la representacion en funcion de transferencia, la primera es mas
general. Esto se ve reflejado en el hecho de que la funcion de transferencia
solo representa la parte de lo que en variables de estado es controlable y
observable de manera simultanea. Es decir, hay partes de un sistema que no
pueden ser descritas por la funcion de transferencia. Sin embargo, el hecho
de que un sistema sea controlable y observable simplifica mucho las tareas
de analisis y diseno de sistemas de control. De hecho, existen resultados muy
poderosos para este caso como los presentados en las secciones 7.10 y 7.11.
7.16 Ejercicios propuestos 441

Una ventaja del enfoque de las variables de estado es que con el se pue-
den resolver problemas que seran mas elaborados si se usara el enfoque de
la funcion de transferencia. Dos ejemplos de esta situacion son los prototipos
controlados experimentalmente en los captulos 13 y 14, donde se deben con-
trolar dos variables simultaneamente: las posiciones del brazo y del pendulo
(en el captulo 13) y la posicion del pendulo y la velocidad de la rueda inercial
(en el captulo 14). Estos problemas se complican usando el enfoque de la
funcion de transferencia donde solo se puede controlar una variable: la sali-
da. Ademas, otra ventaja del enfoque de las variables de estado es que con
el se puede desarrollar una metodologa general para obtener aproximaciones
lineales de sistemas no lineales (vease la seccion 7.2 y los captulos 11, 13 y
14)

7.15. Preguntas de repaso

1. Que significa el hecho de que una ecuacion dinamica sea controlable?


2. Que significa que una ecuacion dinamica sea observable?
3. Como verifica si una ecuacion dinamica es controlable y observable?
4. Que utilidad tiene el hecho de que una ecuacion dinamica sea controlable?
5. Que utilidad tiene el hecho de que una ecuacion dinamica sea observable?
6. Que diferencia existe entre la salida y el estado?
7. Suponga una ecuacion dinamica que es controlable y observable Que re-
lacion existe entre los polos de la funcion de transferencia correspondiente
y los eigenvalores de la matriz A?
8. Que significa que el origen sea globalmente asintoticamente estable?
9. Cuales son las condiciones para que el origen sea globalmente asintotica-
mente estable?
10. Por que es importante que el origen del estado de una ecuacion dinamica
sin entrada sea globalmente asintoticamente estable?
11. Que significa control por realimentacion del estado?
12. Que es un observador de estado y para que sirve?

7.16. Ejercicios propuestos

1. Diga que entiende por estado y proponga un ejemplo de una planta o


proceso fsico indicando cual es su estado.
2. Como sabe si un sistema es controlable u observable? Una vez que sabe
esto Cual es su utilidad?
3. Que significa que el estado x = 0 sea globalmente asintoticamente estable
y como se asegura esto?
4. Verifique que las siguientes ecuaciones dinamicas son controlables:
442 7 La tecnica de las variables de estado

21 3 0
A = 5 9 7, B = 0, C= 472
02 8 2


0 1 0 0
A = 0 20 50 , B = 0 , C= 100
0 5 250 100


01 0 0 0
0 0 0.5 0 1
A=
0 0 0 1,
B=
0 , C= 1010
0 0 50 0 5

Calcule la matriz P definida en (7.77).


Calcule las matrices y vectores A = P AP 1 , B = P B, C = CP 1
definidos en (7.78).
Compruebe que estas matrices y vectores tienen las formas definidas
en (7.75).
Con estos resultados diga cual es la funcion de transferencia de la
ecuacion dinamica dada.
Utilice software especializado para calcular la funcion de transferencia
de la ecuacion dinamica dada. Verifique que este resultado y el del
inciso anterior sean iguales.
Use software especializado para simular la respuesta de la ecuacion
dinamica dada y de la funcion de transferencia encontrada ante una
entrada escalon unitario. Grafique la salida en ambas simulaciones y
comparelas. Que concluye?
5. Haga un programa de computadora que ejecute el procedimiento listado
al final de este captulo para calcular el vector de ganancias K que asig-
ne los eigenvalores que se deseen a la matriz de lazo cerrado A BK.
Utilice este programa para calcular las ganancias de los controladores por
realimentacion de estado de los captulos 13 y 14.
6. La siguiente expresion constituye un filtro donde y(t) es una aproximacion
de la derivada respecto al tiempo de u(t).
as
Y (s) = U (s), a>0
s+a
De hecho, y(t) es conocida como la derivada sucia de u(t) y es muy
utilizada para estimar la velocidad y(t) en sistemas mecanicos a partir
de la posicion u(t). Con el fin de construir en la practica este filtro se
procede obtener una ecuacion dinamica que lo represente. Encuentre dicha
ecuacion dinamica. Recuerde que u(t) debe ser la entrada. Puede usar
los conceptos de respuesta en frecuencia para elegir el valor de a?
7.16 Ejercicios propuestos 443

7. Considere el sistema ball and beam estudiado en el ejemplo 7.2 del presente
captulo, junto con los siguientes valores numericos:

k = 16.6035, a = 3.3132, =5

Obtenga la ecuacion dinamica correspondiente cuando el estado se


define como z = [x xd , x, , ]T y la salida es = x xd , donde xd
es una constante que representa el valor deseado de la posicion x.
Disene un controlador por realimentacion de estado que permita esta-
bilizar el sistema en x = xd , x = = = 0. Seleccione los eigenvalores
deseados del siguiente modo. Proponga dos parejas de tiempo de su-
bida y sobre paso deseados. Usando las expresiones presentadas en
(3.59) en el captulo 3, determine dos parejas de eigenvalores comple-
jos conjugados de manera que se obtengan las dos parejas de tiempo
de subida y sobre paso deseados.
Disene un observador de estado que permita estimar todo el estado del
sistema. Recuerde que los eigenvalores de la matriz A LC deben ser
varias veces mas rapidos que los eigenvalores de la matriz A BK.
Construya un sistema en lazo cerrado que use el observador arriba
disenado y un controlador que realimente el estado estimado para es-
tabilizar el sistema en x = xd , x = = = 0. Mediante simulaciones
verifique si se han obtenido las caractersticas de respuesta transitoria
deseadas.
Referencias

1. C.-T. Chen, Linear system theory and design, Holt, Rinehart and Winston, New
York, 1984.
2. C.R. Wylie, Matematicas superiores para ingeniera, 2a. edicion en espanol,
McGraw-Hill, Mexico, 1994.
3. W.L. Brogan, Modern control theory, 3rd. edition, Prentice Hall, Upper Saddle
River, 1991.
4. E. Kreyszig, Matematicas avanzadas para ingeniera, Vol. 1, Limusa, Mexico,
1980.
5. M. R. Spiegel, Manual de formulas y tablas matematicas., McGraw-Hill, Serie
Schaum, Mexico, 2002.
6. C.-T. Chen, Linear system theory and design, Oxford University Press, New
York, 1999.
7. K. Ogata, Ingeniera de Control Moderna, 4a. edicion, Pearson Prentice-Hall,
Madrid, 2003.
8. N.S. Nise, Sistemas de control para ingeniera, 1a. edicion en espanol, 1a. Re-
impresion, CECSA, Mexico, 2004.
9. R.C. Dorf y R.H. Bishop, Sistemas de control moderno, 10a. edicion, Pearson
Prentice-Hall, Madrid, 2008.
8
Circuitos electronicos realimentados

R L
R2

Q CC
C1
Rt
C3
CBP R1
RE C2

La primera aplicacion importante de la realimentacion, desde el punto de


vista tecnologico, fue el regulador de velocidad para la maquina de vapor de-
sarrollado por Watt. Sin embargo, las tecnicas de control clasico surgieron
como una solucion para los problemas que se presentaban en los circuitos
electronicos de las companas telefonicas. Se descubrio que si se realimentaba
una pequena cantidad de la senal a la salida de un amplificador electronico
entonces se poda disminuir la distorsion que produca dicho amplificador. Las
tecnicas de control clasico tambien demostraron ser fundamentales para di-
senar circuitos que, realimentados, son capaces de producir senales con forma
de onda sinusoidal como el oscilador Colpitts mostrado en la figura.
448 8 Circuitos electronicos realimentados

Objetivos del captulo

Usar la realimentacion para reducir la distorsion producida por circuitos


electronicos no lineales.
Construir controladores analogicos usando circuitos electronicos realimen-
tados.
Disenar y construir osciladores de audiofrecuencia y de radiofrecuencia
con forma de onda sinusoidal.
En este captulo se presentan algunas aplicaciones de los sistemas reali-
mentados al diseno de circuitos electronicos. Algunas de estas aplicaciones
seran utilizadas en el diseno de otros sistemas de control que se presentan en
los captulos subsecuentes. Por otro lado, algunas de estas aplicaciones, como
los circuitos osciladores, son en s mismas sistemas de control completos que
requieren el empleo de los conceptos de teora de control vistos en la captulos
precedentes.

8.1. Circuitos electronicos para reducir no linealidades

R ( s) + C ( s)
A

Figura 8.1. Sistema en lazo cerrado.

Considere el sistema en lazo cerrado mostrado en la figura 8.1. La corres-


pondiente funcion de transferencia es:
R(s) A
=
C(s) 1 + A
donde A y son constantes positivas. Suponga que A 1, entonces se puede
escribir:
R(s) A 1
= (8.1)
C(s) 1 + A
Las aplicaciones de este hecho son importantes en circuitos electronicos reali-
mentados como se explica a continuacion.
8.1 Circuitos electronicos para reducir no linealidades 449

Suponga que A es la ganancia de un amplificador de potencia. Tal como


su nombre lo indica, este tipo de amplificadores normalmente estan construi-
dos de manera que tengan la capacidad para manejar altas potencias. Esto
significa que sus componentes deberan soportar, entre otras cosas, grandes
variaciones de temperatura. Por esta razon, es comun que estos componentes
no sean de gran precision y es de esperarse que el valor de sus parametros
cambien en un amplio rango. Por tanto, suponer que el valor de A esta sujeto
a cambios es algo que seguramente ocurre en la realidad. De acuerdo a (8.1)
el uso de realimentacion alrededor de un amplificador de ganancia A tiene
la ventaja de conseguir que la ganancia del circuito realimentado solo ten-
ga variaciones muy pequenas a pesar de que A presente grandes variaciones.
Por tanto, la realimentacion puede resolver el problema de un amplificador
de potencia cuya ganancia varia fuertemente. Un aspecto importante es que
la ganancia no tenga variaciones y esto se consigue si tal ganancia es fijada
por componentes que solo manejan pequenas cantidades de potencia y, por
tanto, que puedan ser seleccionados como dispositivos de precision.
A continuacion se presentan algunas aplicaciones donde se usa la reali-
mentacion para reducir las variaciones de las ganancias de algunos circuitos
electronicos, lo cual tambien puede entenderse como la reduccion del compor-
tamiento no lineal de dichas ganancias.

8.1.1. Reduccion de la distorsion en amplificadores

Vi + u Vo
Preamplificador Amplificador
no lineal

Figura 8.2. Uso de realimentacion en un amplificador no lineal para reducir la


distorsion.

Considere el diagrama mostrado en la figura 8.2. El amplificador no lineal


es un amplificador que tiene una ganancia A1 = 2 cuando el voltaje de entrada
u es negativo y una ganancia A2 = 0.5 cuando el voltaje de entrada u es
positivo. Esta caracterstica puede representarse como se muestra en la figura
8.3. Por tanto, dicho amplificador entrega a su salida una version distorsionada
de lo que se aplica a su entrada. En la figura 8.4 se muestra la senal a la salida
del amplificador no lineal cuando se aplica a su entrada una senal sinusoidal.
Este es un buen ejemplo de lo que se quiere decir cuando se habla de distorsion.
450 8 Circuitos electronicos realimentados

Vo

0:5

u
2

Figura 8.3. Caracterstica del amplificador no lineal en la figura 8.2.

Combinando el efecto de todos los amplificadores en el trayecto directo se


concluye que el diagrama de bloques de la figura 8.2 se puede representar por
un diagrama de bloques como el de la figura 8.1 donde:

A = A1 A0 , u < 0,
A = A2 A0 , u > 0,
= 1, por ejemplo

A0 es la ganancia del preamplificador y tiene un valor muy grande. Notese


que se obtiene la siguiente funcion de transferencia de lazo cerrado:

R(s) A 1
= =1
C(s) 1 + A

si las ganancias A0 y son tales que A 1 para ambos valores A1 , A2 .


De esta manera el circuito en lazo cerrado de la figura 8.2 funciona como
un amplificador de ganancia constante para ambos signos de la senal que
se desea amplificar. Esto significa que se ha eliminado la distorsion debida
al amplificador no lineal de ganancias A1 y A2 . Esto representa la principal
ventaja de usar la realimentacion mostrada en la figura 8.2 a pesar de que
se haya tenido que cambiar la ganancia total del amplificador que ahora es
1/ = 1. En la figura 8.5 se muestra la forma de onda obtenida Vo a la salida
del del sistema realimentado de la figura 8.2 cuando Vi es una senal sinusoidal.
Observe como es que Vo tiene amplitudes iguales en ambos semiciclos cuando
un amplificador no lineal (de ganancia A) se encuentra inmerso en el sistema
realimentado. A esto se le llama eliminacion o reduccion de la distorsion.
8.1 Circuitos electronicos para reducir no linealidades 451

t
u

Vo

Figura 8.4. Voltajes a la entrada u y a la salida Vo del amplificador no lineal de la


figura 8.3.

V i; V o

Figura 8.5. Voltajes de entrada Vi y de salida Vo en la figura 8.2.

8.1.2. Reduccion de la zona muerta en amplificadores.

En la figura 8.6 se muestra un amplificador de potencia en base a dos tran-


sistores conectados en simetra complementaria. Este circuito tiene una zona
muerta entre 0.6[V] y +0.6 [V] debido al voltaje de polarizacion requerido
en las uniones base-emisor de los transistores. Esto significa que la senal de
salida Vo se mantiene en cero mientras la senal de entrada u se mantenga
en el rango [0.6, +0.6][V]. En la figura 8.7 se muestra la caracterstica que
representa a este amplificador no lineal. En la figura 8.8 se muestra la senal
obtenida a la salida del amplificador Vo cuando se aplica una senal sinusoidal
a la entrada u. Notese el efecto que la zona muerta tiene para valores de u
cercanos a cero. El circuito de la figura 8.9 se utiliza para reducir el efecto de
dicha zona muerta. El objetivo es conseguir que la forma de onda obtenida a la
salida Vo sea identica, o muy parecida, a la forma de onda de la senal aplicada
Vi , tal como se muestra en la figura 8.10 y, de este modo, reducir fuertemente
452 8 Circuitos electronicos realimentados

+ V cc

u Vo

V cc
Figura 8.6. Transistores conectados en simetra complementaria. Ejemplo de un
amplificador de potencia no lineal.

Vo

1
0:6

1 + 0:6 u

Figura 8.7. Caracterstica del amplificador no lineal de la figura 8.6.

o eliminar el efecto de la zona muerta gracias al uso de realimentacion. A


continuacion se explica como es que se consigue esto.
El circuito de la figura 8.9 se puede representar por el diagrama de bloques
de la figura 8.1. Este sistema realimentado tiene un funcion de transferencia
en lazo cerrado dada como:
R(s) A
= , R(s) = Vo (s), C(s) = Vi (s)
C(s) 1 + A
R1
= 1
R1 + R2
8.1 Circuitos electronicos para reducir no linealidades 453

Vo
t

Figura 8.8. Voltajes a la entrada u y a la salida Vo del amplificador de la figura


8.6.

+ V cc

Vi
+ u Vo

V cc

R2
R1

Figura 8.9. Circuito realimentado para reducir el efecto de la no linealidad presente


en el amplificador de la figura 8.6.

donde A = A0 , con A0 la ganancia de lazo abierto del amplificador operacio-


nal utilizado para realizar el punto de suma y la ganancia de la caracterstica
mostrada en la figura 8.7 (zona muerta). Es bien sabido que A0 tiene un valor
muy grande, del orden de 100 000, mientas que tiene un valor que, aunque
variable, es del orden de la unidad. Por tanto, A = A0 1 y se puede
aproximar, con poco margen de error a:
Vo (s) A 1
= (8.2)
Vi (s) 1 + A
454 8 Circuitos electronicos realimentados

V i; V o

Figura 8.10. Voltajes a la entrada Vi y a la salida Vo del circuito de la figura 8.9.

La expresion (8.2) indica que el circuito completo se comporta como un ampli-


ficador de ganancia constante 1/ que elimina o reduce fuertemente el efecto
de la zona muerta de modo que la forma de onda de Vo is igual a la de Vi .
Notese que R1 y R2 se pueden seleccionar de valor grande para asegurar
que manejen poca corriente (poca potencia) por lo que pueden usarse resis-
tencias de precision. Tambien es importante aclarar lo siguiente. De acuerdo a
la figura 8.7 el valor de es cero para valores de u en el rango [0.6, +0.6][V].
Esto sugiere que la condicion A = A0 1 no se cumple. Sin embargo,
debe entenderse que la caracterstica mostrada en la figura 8.7 es una ideali-
zacion de lo que realmente sucede en la practica y que en la realidad Vo solo
es cero cuando u tambien es cero.
En la figura 8.11 se muestran los voltajes u y Vo correspondientes a la
figura 8.6 obtenidos durante un experimento. Se utilizan los transistores tipo
Darlington TIP 141 (NPN) y TIP 145 (PNP). Esto significa que el voltaje de
union base-emisor tiene un voltaje nominal de polarizacion directa de alrede-
dor de 1.2[V] y, por tanto, la zona muerta en este caso esta en el intervalo
[-1.2,+1.2][V] del voltaje de entrada u. El voltaje u es una senal sinusoidal
de 2.083[KHz] de 1[V] de pico. Esto situa al voltaje de la union base-emisor
claramente por debajo de su valor de polarizacion directa. Es importante men-
cionar que se conecta una resistencia de carga de 1[KOhm] entre los emisores
y tierra. Notese que el voltaje Vo tiene una forma de onda muy distinta a
una sinusoide (compare con el trazo punteado en la figura 8.8), por lo que se
confirma experimentalmente que la conexion en simetra complementaria de
dos transistores distorsiona fuertemente la senal.
En la figura 8.12 se muestran las formas de onda de las senales Vi y Vo
correspondientes a la figura 8.9. Estas mediciones se obtuvieron en un expe-
rimento donde se utilizan los transistores tipo Darlington TIP 141 (NPN) y
TIP 145 (PNP) y el voltaje Vi es una senal sinusoidal de 2.083[KHz] de 1[V]
de pico, es decir, como en el experimento de la figura 8.11. Tambien se utilizan
los valores de resistencia R1 = R2 = 10[KOhm] y una resistencia de carga de
1[KOhm] entre los emisores y tierra. El amplificador operacional utilizado es
el TL081. Notese que la forma de onda de Vo es como la de Vi , es decir, ambas
son sinusoides de la misma frecuencia, aunque la amplitud de Vo es el doble
8.1 Circuitos electronicos para reducir no linealidades 455

que la de Vi . Esto se debe a que, de acuerdo (8.2) se tiene que:

Vo (s) 1 R1
= = 2, = = 0.5
Vi (s) R1 + R2

Figura 8.11. Resultados experimentales. Voltajes a la entrada y a la salida del


circuito de la figura 8.6. Trazo superior: Vo , trazo inferior: u.

Figura 8.12. Resultados experimentales. Voltajes a la entrada y a la salida del


circuito de la figura 8.9. Trazo superior: Vo , trazo inferior: Vi .
456 8 Circuitos electronicos realimentados

Para el estudio de otras aplicaciones de la realimentacion en circuitos elec-


tronicos se recomienda consultar [1].

8.2. Construccion analogica de controladores

Z2 (s)
V 1 (s)
Z1 (s)
E i (s)
E o (s)

Figura 8.13. Construccion de un controlador analogico usando un amplificador


operacional.

Considere el circuito de la figura 8.13 donde Z1 (s) y Z2 (s) representan las


impedancias de dos redes pasivas colocadas en esos lugares. En el amplificador
operacional se cumple:

Eo (s) = (0 V1 (s))A0 = V1 (s)A0 (8.3)

donde A0 es la ganancia de lazo abierto del amplificador operacional la cual


es muy grande (del orden de 100 000 [2], pag. 500). Para calcular el valor de
V1 se usan los circuitos auxiliares mostrados en las figuras 8.14(a) y 8.14(b).
De aqu se encuentra que:
Z1 (s)
V1 (s) = (Eo (s) Ei (s)) + Ei (s)
Z1 (s) + Z2 (s)

Z1 (s) Z1 (s)
= Eo (s) + Ei (s) 1
Z1 (s) + Z2 (s) Z1 (s) + Z2 (s)
Usando (8.3) se encuentra:

Z1 (s) Z1 (s)
Eo (s) = Eo (s) + Ei (s) 1 A0
Z1 (s) + Z2 (s) Z1 (s) + Z2 (s)
de donde se obtiene:

Z1 (s)
Eo (s) A0 1 Z1 (s)+Z2 (s)
= Z1 (s)
Ei (s) 1 + A0 Z1 (s)+Z 2 (s)
8.2 Construccion analogica de controladores 457

Z2 (s)

V Z1 (s) Z1 (s)

E o (s) V 1 (s)

E i (s)

(a)

Z2 (s)

E o (s) E i (s) V Z1 (s) Z1 (s)

(b)

Figura 8.14. Circuitos equivalentes del circuito mostrado en la figura 8.13

Reduciendo terminos:

Z2 (s)
Eo (s) A0 Z1 (s)+Z2 (s)
= Z1 (s)
Ei (s) 1 + A0 Z1 (s)+Z 2 (s)

Z1 (s)
Se puede considerar que A0 Z1 (s)+Z 2 (s)
1, debido a que A0 es muy grande,
y por tanto:
Eo (s) Z2 (s)
= (8.4)
Ei (s) Z1 (s)
Z1 (s)
Notese, sin embargo, que el cumplimiento de la condicion A0 Z1 (s)+Z 2 (s)
1
depende del valor de A0 . Es importante mencionar que en los amplificadores
operacionales que se usan en la practica, la ganancia A0 no es constante sino
que varia con la frecuencia de las senales que esta procesando el amplificador
operacional. Es comun que A0 disminuya al aumentar dicha frecuencia del
mismo modo en que vara la caracterstica de magnitud de un filtro pasa
Z1 (s)
bajas [2], pag. 500. Como consecuencia, la condicion A0 Z1 (s)+Z 2 (s)
1 y
(8.4) dejan de ser ciertas a altas frecuencias. Por otro lado, la manera en que
vara A0 con la frecuencia depende del amplificador operacional utilizado. Esto
significa que se debe tener cuidado de seleccionar el amplificador operacional
458 8 Circuitos electronicos realimentados

correcto de acuerdo al tipo de aplicacion en cuestion, es decir, de acuerdo a


la rapidez de respuesta de la planta o sistema a controlar.
En la tabla 8.1 se muestran algunos ejemplos de redes usadas para formar
Z1 (s) y Z2 (s), as como el controlador analogico que puede ser construido al
utilizarlas. Se deja como ejercicio que el lector calcule los valores de Z1 (s) y
Z2 (s) para cada una de las redes electricas mostradas y que verifique, usando
(8.4), que se obtiene la funcion de transferencia del controlador mostrado en
la columna del extremo derecho de la figura. Entiendase con esto la mane-
ra de construir practicamente y de manera analogica una gran parte de los
controladores que se utilizan en control clasico. Vease [3] para una tabla mas
completa que incluye controladores adicionales. Se aclara que, sin embargo,
estos mismos controladores pueden ser construidos usando una computadora
digital o un microcontrolador si no se desea utilizar electronica analogica.

Tabla 8.1. Construccion analogica de controladores.


2 (s)
Controlador Z1 (s) Z2 (s) Z
Z1 (s)

R2 , C s+ R 1C
PI R1 R2 2
en serie R1 s

R1 , C
PD R2 R2 C s + R11C
en paralelo
R1 , C1 R2 , C2 1
PID R 2
+ C1
+ R2 C1 s + R1 C2
en paralelo en serie R1

C2

s
1
R1 , C1 R2 , C2 s+
Red de adelanto C 1 R C
1 1
, R1 C1 > R2 C2
en paralelo en paralelo C2 s+ 1
R2 C2

8.3. Diseno de osciladores con forma de onda sinusoidal


El proposito de esta seccion es mostrar como se puede usar la teora de
control para disenar circuitos electronicos realimentados que generen senales
con forma de onda sinusoidal. Se presenta un diseno basado en un amplificador
operacional y un diseno basado en un transistor.
El circuito que se propone usando amplificadores operacionales simplifica
enormemente el analisis y el diseno, ademas es muy util para trabajar a fre-
cuencias bajas ya que evita el uso de inductancias. Es importante subrayar
que el valor de las inductancias que se necesitan para generar oscilaciones de
baja frecuencia es tan grande que el tamano geometrico de la inductancia se
convierte en un problema. La principal desventaja de este diseno es que no es
util para trabajar en altas frecuencias (en la banda de radiofrecuencia) debido
a las limitaciones de operacion de los amplificadores operacionales.
Por otro lado, el uso de transistores tiene la caracterstica de que la impe-
dancia del circuito de entrada se ve reflejada en el circuito de salida. Esto hace
8.3 Diseno de osciladores con forma de onda sinusoidal 459

un poco mas elaborado el analisis y diseno simplemente porque la obtencion


de las funciones de transferencia involucradas ahora require de mas desarrollos
algebraicos. Sin embargo, la principal ventaja de usar transistores es que se
puede construir osciladores que trabajan a altas frecuencias, es decir, en la
banda de radiofrecuencia. Tambien resulta interesante el uso de transistores
por la siguiente situacion. Tal como se muestra en lo que resta de esta seccion,
cuando se usan amplificadores operacionales el circuito resultante es comple-
tamente lineal y se debe introducir, de manera artificial, un elemento no lineal
para conseguir la construccion practica del oscilador. Por el contrario, dado
que el transistor es un dispositivo no lineal es precisamente esta caracterstica
la que permite, de manera natural, el correcto funcionamiento del oscilador.

8.3.1. Diseno basado en un amplificador operacional. Puente de


Wien
Considere el circuito mostrado en la figura 8.15. En el ejemplo 2.16 del
captulo 2, se encontro que la relacion entre los voltajes Eo (s) y Ei (s) esta da-
da en (2.143), expresion que se reescribe a continuacion para facilitar la refe-
rencia:

I(s) R C
+ +

E i (s) C R E o (s)

Figura 8.15. Circuito RC serie-paralelo.

Eo (s) Ts
= GT (s) = 2 2 , T = RC (8.5)
Ei (s) T s + 3T s + 1
Ahora considere el circuito de la figura 8.16 donde se introduce un amplificador
no inversor a base de un amplificador operacional. Siguiendo el procedimiento
presentado en la seccion 8.2 se encuentra que la ganancia del circuito de la
figura 8.17 es constante e igual a:

R1 + Rf Vo
A= =
R1 Vi
Notese que que a partir de este circuito se puede obtener el diagrama de blo-
ques mostrado en la figura 8.18(a) de donde se obtiene el diagrama de bloques
460 8 Circuitos electronicos realimentados

C R

Vo
R Vi C
Rf
R1

Figura 8.16. Circuito oscilador en base a un amplificador operacional.

Vi
Vo

Rf
R1

Figura 8.17. Amplificador no inversor.

de la figura 8.18(b). Es importante observar que de acuerdo a estos diagramas


de bloques el circuito de la figura 8.16 es un circuito con realimentacion posi-
tiva. Dado que toda la teora desarrollada en sistemas de control esta hecha
pensando en que se disenaran sistemas de control con realimentacion negativa
como el mostrado en la figura 8.18(d) es necesario transformar el diagrama de
bloques de la figura 8.18(b) en una forma mas conveniente. Esto se consigue
en la figura 8.18(c) donde se introduce un signo negativo en la realimentacion
que se ve compensado con un cambio de signo en la funcion de transferencia
de trayecto directo. Esto significa que ahora se cuenta con un sistema con
realimentacion negativa que es equivalente al de la figura 8.18(b) y al de la
figura 8.18(d). Por tanto, la funcion de transferencia de lazo abierto esta dada
8.3 Diseno de osciladores con forma de onda sinusoidal 461

como:

G(s)H(s) = GT (s)A (8.6)

0 + E i ( s) E o ( s)
Circuito RC
serie paralelo
+

Amplificador
Vo no inversor Vi

(a)
0 + E i ( s) E o ( s)
G T (s)
+

R f +R 1
R1
Vo Vi
(b)

0 + E i ( s) E o ( s)
G T (s)

R f +R 1
R1
Vo Vi
(c)
R (s) C(s)
G (s)
+
H (s)

(d)

Figura 8.18. Diagramas de bloques equivalentes del circuito en la figura 8.16.


462 8 Circuitos electronicos realimentados

Analisis basado en la respuesta en el tiempo

Este metodo se refiere al estudio del circuito a traves de localizar la ubi-


cacion de sus polos. A partir del estudio sobre ecuaciones diferenciales en el
captulo 3 se sabe que para tener oscilaciones sostenidas los polos de lazo
cerrado deben ser imaginarios puros, es decir, con parte real cero y parte ima-
ginaria diferente de cero. Bajo esta situacion, la frecuencia de oscilacion, en
radianes/segundo, es igual a la parte imaginaria de dichos polos.
Se sabe que los polos de lazo cerrado satisfacen:

1 + G(s)H(s) = 0

Sustituyendo las ecuaciones (8.6) y (8.5) se obtiene:

T As
1 + G(s)H(s) = 1 GT (s)A = 1
T 2 s2 + 3T s + 1
T 2 s2 + 3T s + 1 T As
= =0
T 2 s2 + 3T s + 1
y, por tanto, los polos de lazo cerrado satisfacen:

T 2 s2 + (3 A)T s + 1 = 0

Los polos de lazo cerrado son las races del polinomio del lado izquierdo, es
decir:
p
(3 A)T + (3 A)2 T 2 4T 2
s1 = 2
p2T
(3 A)T (3 A)2 T 2 4T 2
s2 =
2T 2
Notese lo siguiente:
Ambos polos tienen parte imaginaria diferente de cero y, por tanto, el
circuito presentara oscilaciones si:

(3 A)2 T 2 4T 2 < 0

es decir, si 5 > A > 1.


Si A > 3, entonces ambos polos tienen parte real positiva, es decir, el
circuito es inestable lo cual es altamente indeseable.
Si A < 3, entonces ambos polos tienen parte real negativa, es decir, el
circuito es estable. Esto, sin embargo, tampoco es deseable porque la res-
puesta del circuito sera tal que poco a poco dejara de oscilar.
Si A = 3, entonces los dos polos tienen parte real cero y, por tanto, son
imaginarios puros, tal como se desea. Estos polos estan ubicados en s1,2 =
j T1 . Por tanto, la frecuencia de oscilacion es = T1 = RC
1
.
8.3 Diseno de osciladores con forma de onda sinusoidal 463

Analisis basado en la respuesta en la frecuencia

Introduzcase el cambio de variable s = j en (8.5):

jT
GT (j) =
T 2 (j)2 + 3jT + 1

Evaluando en la frecuencia = 1/T = 1/(RC) se obtiene:


1
GT (j/T ) =
3
Para obtener la grafica de Bode de GT (s) se reescribe:
1
T2
GT (s) = T s 3 1 (8.7)
s2 + Ts + T2

La grafica de Bode de GT (s) se muestra en la figura 8.19. La magnitud de


GT (j) es maxima (e igual a 13 ) en la frecuencia = 1/T = 1/(RC), justo
cuando la fase de GT (j) es cero.

ii)
dB 1

0 1 T
!
iv)
i)
iii)

1
T
fase + 90 ii)
[grados] !
0
iv)
90
iii)
180
1
T2
Figura 8.19. Graficas de Bode de GT (s) en (8.7). i) T , ii) s, iii) 3 s+ 1
s2 + T
, iv)
T 2
GT (s).

La grafica polar de G(s)H(s) dada en (8.6) se muestra en la figura 8.20. El


uso de la grafica de Bode de GT (s) mostrada en la figura 8.19 permite concluir
que la grafica polar de G(s)H(s), mostrada en en la figura 8.20, consiste en una
trayectoria cerrada que es recorrida dos veces en sentido horario. Observese
que el signo negativo en (8.6) cambia la fase en 180 de cada uno de los puntos
de la grafica de Bode de GT (s). Notese tambien que la grafica polar de la figura
R +R
8.20 cruza el eje real negativo en el punto 13R1 f a la frecuencia = 1/T =
464 8 Circuitos electronicos realimentados

Im (G(j!)H(j!))

A3 ! =+1

( 1; j0)
! = 1 !=0
T
! = 1 Re (G(j!)H(j!))

Figura 8.20. Grafica polar de G(s)H(s) en (8.6).

1/(RC). Por otro lado, como la grafica polar incluye frecuencias positivas
y negativas y es simetrica respecto al eje real para frecuencias negativas y
R +R
positivas entonces el eje real negativo tambien es cruzado en el punto 13R1 f
a la frecuencia = 1/T = 1/(RC). Notese tambien que el numero de polos
inestables de lazo abierto que tiene la funcion dada en (8.6) es cero, es decir
P = 0, ya que todos los coeficientes del polinomio del denominador de GT (s)
son positivos (vease la seccion 4.2.1).
Finalmente, antes de aplicar el criterio de Nyquist se debe observar lo
siguiente. Como G(s)H(s) tiene un cero en s = 0, es decir sobre el eje imagi-
nario, se debe hacer un rodeo como el mostrado en la figura 6.44 solo que en
este caso es un cero (en lugar de un polo) el que se debe rodear. Sin embar-
go, sobre todo ese rodeo s = donde 0 y, por tanto, G(s)H(s) 0
tambien sobre todo ese rodeo. Es decir, G(s)H(s) representa un solo punto
en el origen para todo ese rodeo. Por tanto, al aplicar el criterio de Nyquist
se tienen tres casos:
R +R
1. Si 13R1 f > 1, entonces el numero de vueltas alrededor del punto (1, j0)
es N = 2, por lo que el numero de polos inestables de lazo cerrado es Z =
N + P = 2. Esto significa inestabilidad del circuito lo cual es altamente
indeseable.
R +R
2. Si 13R1 f < 1, entonces el numero de vueltas alrededor del punto (1, j0)
es N = 0, por lo que el numero de polos inestables de lazo cerrado es
Z = N + P = 0. Aunque esto significa que el circuito es estable, sin
embargo tampoco es deseable porque la respuesta del circuito sera tal que
poco a poco dejara de oscilar.
R +R
3. Si 13R1 f = 1, entonces el circuito es marginalmente estable, es decir se tie-
nen polos de lazo cerrado que estan sobre el eje imaginario. Esto tambien
puede entenderse del siguiente modo. De acuerdo a la discusion previa,
8.3 Diseno de osciladores con forma de onda sinusoidal 465

la grafica polar de la figura 8.20 cruza el eje real negativo en el punto


(1, j0) a las frecuencias = 1/T = 1/(RC) y = 1/T = 1/(RC).
Esto significa que G(j)H(j)|=1/T = 1 y G(j)H(j)|=1/T = 1,
es decir, 1 + G(s)H(s)|s=j/T = 0 y 1 + G(s)H(s)|s=j/T = 0. Dado que
1 + G(s)H(s) = 0 es la condicion que deben satisfacer los valores de s que
son polos de lazo cerrado, se concluye que hay dos polos de lazo cerrado
que son imaginarios puros conjugados colocados en s = j/T y s = j/T .
Por tanto, el circuito oscilara permanentemente con frecuencia = 1/T .

Un circuito oscilador practico

A partir de la discusion previa se concluye que la ganancia del amplificador


basado en amplificadores operacionales se debe seleccionar como:
R1 + Rf
A= =3
R1
Sin embargo, el circuito de la figura 8.16 no podra oscilar de manera satis-
factoria. La razon de esto es que es no se pueden obtener resistencias reales
R +R
Rf y R1 cuyos valores satisfagan exactamente 1R1 f = 3, ademas la mas
pequena variacion en sus valores hara inestable al circuito o hara que deje de
oscilar. Esta es una muestra de un hecho bien conocido: un circuito oscilador
lineal no oscila satisfactoriamente en la practica por lo que todos los circuitos
osciladores que se construyen son no lineales.

33nF 4:7k

+

Zeners
10k eo
25:6k 3:6V
4:7k 33nF

10k

Figura 8.21. Circuito oscilador practico.

La manera de construir un oscilador practico usando los conceptos teori-


cos presentados previamente es utilizando el circuito de la figura 8.21, al cual
466 8 Circuitos electronicos realimentados

se le incluye una no linealidad mediante la introduccion de dos diodos zener.


Suponga que A > 3 por lo que el circuito es inestable y empieza a oscilar con
una amplitud que crece con cada oscilacion. La funcion de los diodos zener
es poner en corto a la resistencia de 10[KOhm] cuando alcancen su voltaje de
avalancha. De esta manera se reducira la ganancia A del amplificador cuando
la amplitud del voltaje de salida supere un umbral determinado. Esto hara que
que A < 3 por lo que la amplitud de la oscilacion tendera a disminuir lo cual,
a su vez, reduce el voltaje en los diodos zener que dejaran de conducir por lo
que desaparecera el corto alrededor de la resistencia de 10[KOhm] y se obten-

Figura 8.22. Forma de onda del voltaje a la salida del amplificador operacional de
la figura 8.21. El potenciometro esta ajustado a 20[KOhm].

Figura 8.23. Forma de onda del voltaje a la salida del amplificador operacional de
la figura 8.21. El potenciometro esta ajustado a 25.6[KOhm].
8.3 Diseno de osciladores con forma de onda sinusoidal 467

dra A > 3 de nuevo. Finalmente, este proceso producira un estado estacionario


en el que habra una oscilacion sinusoidal de amplitud constante. Notese que,
usando los valores de las resistencias en la figura 8.21, A = 45/10 = 4.5 si no
conducen los diodos zener y A = 35/10 = 3.5 si conducen los diodos zener.
As que se debe ajustar el valor del potenciometro de 25.6[KOhm] para obte-
ner un valor de A ligeramente mayor que 3 y conseguir la oscilacion sostenida.
Notese que la frecuencia de oscilacion esperada es:
1 1 1
= = = = 6447[rad/s],
T RC (4.7 103 )(0.033 106 )
6447
f = = = 1.026[KHz]
2 2
En las figuras 8.22 y 8.23 se muestran los resultados experimentales obtenidos
con el circuito de la figura 8.21. El amplificador operacional utilizado es el
UA741. La frecuencia obtenida experimentalmente es 1[KHz]. La amplitud
de oscilacion puede ser modificada si se incrementa el valor de la resisten-
cia del potenciometro de 25.6[KOhm], lo cual incrementa la ganancia de del
amplificar operacional realimentado A. Sin embargo, si esta ganancia es muy
grande la forma de onda sinusoidal se distorsiona. Esto es lo que ocurre en la
figura 8.23 donde se usa el potenciometro 25.6[KOhm] ajustado a su maximo
valor de resistencia. Por el contrario, en la figura 8.22 el potenciometro de
25.6[KOhm] se usa ajustado a un valor de aproximadamente 20[KOhm]. Este
comportamiento significa que la conduccion en la zona de avalancha de los
diodos zener es progresiva, y no abrupta, conforme aumenta la amplitud del
voltaje en la salida del amplificador operacional. De esta manera, una mayor
ganancia de lazo en (8.6) es reducida a la unidad si aumenta la amplitud de
las oscilaciones, es decir, si el funcionamiento de los diodos zener se interna
mas en su region de avalancha.
Finalmente, notese que, de acuerdo a los diagramas de bloques mostrados
en la figura 8.18, el circuito oscilador presentado en esa seccion constituye un
sistema en lazo cerrado sin entrada, es decir, la entrada que se aplica para
que el circuito oscile es igual a cero. Esto no debe sorprender al lector pues en
la seccion 3.3 del captulo 3 se explica claramente que un sistema de segundo
orden (o de orden mayor) puede oscilar aunque la entrada sea cero si las con-
diciones iniciales son diferentes de cero. En este sentido, debe observarse que
a pesar de que el circuito este inicialmente desconectado se pueden producir
pequenas condiciones iniciales diferentes de cero como consecuencia de que el
circuito es perturbado al momento de conectar las fuentes de alimentacion.
Estas condiciones iniciales diferentes de cero, aunque pequenas, son suficientes
para que el circuito empiece a oscilar dada la inestabilidad inicial de circuito
(ya que A > 3 cuando se enciende el circuito).
468 8 Circuitos electronicos realimentados

8.3.2. Diseno basado en un amplificador operacional. Red RC de


defasaje

Considere el circuito mostrado en la figura 8.24. La relacion entre los vol-


tajes V1 (s) y V2 (s) se muestra en (2.146) correspondiente al ejemplo 2.17
del captulo 2. A continuacion se reescribe dicha expresion para facilitar la
referencia:

C C C

+ +
V 1(s) I1 R I2 R I3 R V 2(s)

Figura 8.24. Red RC de defasaje.

V2 (s) R3 C 3 s3
= 3 3 3 = F (s) (8.8)
V1 (s) R C s + 6R2 C 2 s2 + 5RCs + 1

Por otro lado, de acuerdo a la seccion 8.2, el amplificador inversor mostrado


en la figura 8.25 realiza la operacion:
Rf
V1 (s) = V2 (s) (8.9)
R

Rf

R
+
+
V 2(s) +
- V 1(s)
-

Figura 8.25. Amplificador inversor.

Ahora considerese el circuito mostrado en la figura 8.26. Notese que es-


te circuito puede representarse usando el diagrama de bloques en la figura
8.3 Diseno de osciladores con forma de onda sinusoidal 469

Rf

R
+ - +
V 2(s) + V 1(s)
-
-

C C C

R R

Figura 8.26. Circuito oscilador con red RC de defasaje.

8.27(a). Ademas, de acuerdo a las expresiones en (8.8) y (8.9) se obtiene el


diagrama de bloques mostrado en la figura 8.27(b), el cual puede representar-
se como en la figura 8.27(c). Esto ultimo es conveniente para poder utilizar
la configuracion en lazo cerrado con realimentacion negativa. Por tanto, la
funcion de transferencia de lazo abierto esta dada como:
Rf
G(s)H(s) = F (s) (8.10)
R
Se sabe que los polos de lazo cerrado satisfacen:

1 + G(s)H(s) = 0 (8.11)

es decir:
Rf
1+ F (s) = 0 (8.12)
R
De esta condicion se obtiene el siguiente polinomio caracterstico:

(R4 C 3 + Rf R3 C 3 )s3 + 6R3 C 2 s2 + 5R2 Cs + R = 0 (8.13)

De acuerdo al captulo 3, el comportamiento de este circuito depende de las


races del polinomio caracterstico en (8.13). Como este polinomio es de tercer
orden es de mucha utilidad usar el criterio de Routh (seccion 4.3) para estudiar
dichas races y para lo cual se construye la tabla 8.2. A partir de esta tabla
se pueden predecir tres comportamientos diferentes:
470 8 Circuitos electronicos realimentados

V 2(s) V 1(s)
0 + Amplificador
inversor
+

Red RC de
defasaje
(a)

V 2(s) Rf V 1(s)
0 +
R
+

F(s)

(b)

Rf V 1(s)
0 +
R

F(s)
(c)

Figura 8.27. Diagramas de bloques equivalentes del circuito en la figura 8.26.

Tabla 8.2. Aplicacion del criterio de Routh al polinomio caracterstico en (8.13).


s3 R4 C 3 + Rf R3 C 3 5R2 C
s2 6R3 C 2 R
(6R3 C 2 )(5R2 C)R(R4 C 3 +Rf R3 C 3 )
s1 6R3 C 2
0
s0 R

(6R3 C 2 )(5R2 C) R(R4 C 3 + Rf R3 C 3 ) > 0, es decir Rf < 29R. En este


caso, todos los elementos de la primer columna de la tabla 8.2 son positivos
por lo que todas las races del polinomio en (8.13) tienen parte real negativa
8.3 Diseno de osciladores con forma de onda sinusoidal 471

y el circuito es estable. Esto significa que aunque el circuito podra oscilar,


sin embargo esto no sera de manera permanente ya que las oscilaciones
desapareceran al crecer el tiempo.
(6R3 C 2 )(5R2 C) R(R4 C 3 + Rf R3 C 3 ) < 0, es decir Rf > 29R. En este
caso, hay dos cambios de signo al recorrer la primera columna de la tabla
8.2. Esto significa que hay dos races del polinomio en (8.13) que tienen
parte real positiva y el circuito es inestable. Esto significa que aunque el
circuito podra oscilar, sin embargo la amplitud de las oscilaciones crecera
sin lmite al crecer el tiempo, lo cual no es de utilidad en situaciones
practicas.
(6R3 C 2 )(5R2 C) R(R4 C 3 + Rf R3 C 3 ) = 0, es decir Rf = 29R. En este
caso hay un renglon de la tabla 8.2 que esta formado exclusivamente por
ceros (el renglon correspondiente a s1 ). El criterio de Routh establece
(vease la seccion 4.3, ejemplo 4.14) que en este caso se debe calcular la
derivada del polinomio formado con los elementos del renglon s2 , es decir
dP (s) 3 2 3 2 2
ds = 12R C s, donde P (s) = 6R C s +R, sustituir sus coeficientes en
1
el renglon s y continuar con la construccion de la tabla como se muestra en
la tabla 8.3. Como no hay cambios de signo al recorrer la primera columna
de la tabla 8.3 se concluye no existen races con parte real positiva y que
existen races imaginarias conjugadas. As que la condicion:

Tabla 8.3. Aplicacion del criterio de Routh al polinomio caracterstico en (8.13)


(continuacion).
s3 R4 C 3 + Rf R3 C 3 5R2 C
s2 6R3 C 2 R
1
s 12R3 C 2 0
s0 R

Rf = 29R (8.14)
es necesaria para que el circuito de la figura 8.26 pueda oscilar de manera
permanente. Por tanto, lo unico que resta es determinar la frecuencia de
oscilacion. Para esto, es de utilidad recordar otra propiedad de los datos
mostrados en la tabla 8.2 (vease la seccion 4.3, ejemplo 4.14): si uno de los
renglones esta formado exclusivamente por ceros, entonces las races del
polinomio obtenido con los datos del renglon inmediato superior a dicho
renglon de ceros tambien son races del polinomio caracterstico en (8.13).
Es decir, las races de:
6R3 C 2 s2 + R = 0
tambien son races del polinomio caracterstico mostrado en (8.13). Resol-
viendo la expresion anterior se encuentra que las races correspondientes
son imaginarias, como se esperaba:
472 8 Circuitos electronicos realimentados

1 1
s1 = j , s2 = j
6RC 6RC

Esto significa que = 1 = 2f , es decir, que la frecuencia en Hertz


6RC
esta dada como:
1
f= (8.15)
2 6RC
Por tanto, para disenar el circuito oscilador de la figura 8.26 se deben se-
leccionar los valores de R y C de modo que se obtenga la frecuencia de
oscilacion de acuerdo a (8.15) para despues asegurar la oscilacion seleccio-
nando Rf de acuerdo a (8.14).

Un circuito oscilador practico

A partir de la discusion previa se concluye que la relacion entre Rf y R


debe cumplir lo establecido en (8.14). Sin embargo, de manera similar a lo
que ocurre con el circuito oscilador de la seccion 8.3.1, el oscilador de la figura
8.26 debe ser modificado como se muestra en la figura 8.28 para conseguir
una oscilacion satisfactoria. Notese que, usando los valores de las resistencias
R
en la figura 8.28, Rf = 800002200 = 36.36 si no conducen los diodos zener y
Rf 47000
R = 2200 = 21.36 si conducen los diodos zener. As que se debe ajustar el
R
valor del potenciometro de 47[KOhm] para obtener un valor de Rf ligeramente
mayor que 29 y conseguir la oscilacion sostenida. Notese que la frecuencia de
oscilacion esperada es:
1 1
f = = = 2.9534[KHz]
2 6RC 2 6(2200)(0.01 106 )
En la figura 8.29 se muestran los resultados experimentales obtenidos con el
circuito de la figura 8.28. El amplificador operacional utilizado es el UA741. La
frecuencia obtenida experimentalmente es 2.7027[KHz], que es muy cercana a
la disenada: 2.9534[KHz].

8.3.3. Diseno basado en un transistor

En esta seccion se estudia el circuito oscilador mostrado en la figura 8.30, el


cual se conoce como oscilador Colpitts. El transistor es un dispositivo no lineal.
Por esta razon, el problema es abordado de manera similar a como se hace
con las ecuaciones diferenciales no lineales. As, se considera que el circuito
de la figura 8.30 trabaja en un punto de operacion y que permite pequenas
variaciones de sus senales alrededor de dicho punto de operacion. El punto
de operacion esta determinado por el funcionamiento en corriente directa del
circuito de la figura 8.30, mientras que las variaciones alrededor del punto
de operacion se analizan usando un circuito equivalente de senal pequena
8.3 Diseno de osciladores con forma de onda sinusoidal 473

Zeners 3:6V

47k

33k
2:2k
- +
+ v1
-

0:01 F 0:01 F 0:01 F

2:2k 2:2k

Figura 8.28. Circuito oscilador practico.

para el circuito de la figura 8.30. El circuito de senal pequena es similar al


modelo lineal aproximado obtenido para sistemas (ecuaciones diferenciales) no
lineales en la seccion 7.2, el cual es valido solo si permiten pequenas variaciones
alrededor del punto de operacion seleccionado. En el siguiente apartado se

Figura 8.29. Forma de onda del voltaje a la salida del amplificador operacional de
la figura 8.28.
474 8 Circuitos electronicos realimentados

R L
R2

Q CC
C1
Rt
C3
CBP R1
RE C2

Figura 8.30. Oscilador Colpitts.

estudia el circuito bajo condiciones de corriente directa. El analisis del circuito


equivalente de senal pequena se aborda en las subsecuentes secciones.
Dada la gran cantidad de variables involucradas (corrientes y voltajes en
cada elemento de circuito), se hace la siguiente aclaracion en cuanto a la
nomenclatura utilizada. Se usa vR1Q para indicar el voltaje (constante) que
hay en la resistencia R1 en el punto de operacion, vr1 representa las variaciones
de voltaje que hay en la resistencia R1 al rededor del punto de operacion y vR1
es el voltaje total en la resistencia R1 , es decir vR1 = vR1Q +vr1 . Las corrientes
y voltajes en los otros elementos de circuito se definen de manera analoga.
Por otro lado, se usan letras mayusculas para representar la transformada de
Laplace de una variable escrita con letras minusculas, es decir, I(s) = L{i(t)}.

Analisis en corriente directa


El punto de operacion de un transistor esta determinado por los valores
constantes de la corriente de colector iCQ y del voltaje colector-emisor vCEQ .
diLQ dvC1Q dvC2Q
Primero notese que vLQ = L dt = 0, iC1Q = C dt = 0, iC2Q = C dt =
dvC3Q
0 e iC3Q = C dt = 0 porque iLQ , vC1Q , vC2Q e vC3Q son constantes. Por
tanto, para el analisis en corriente directa se usa el circuito de la figura 8.31.
Leyes fundamentales que rigen el funcionamiento del transistor en corriente
directa indican que [1], cap. 5:
iCQ = iBQ , iEQ = (1 + )iBQ , 1, iEQ iCQ , vBEQ = 0.7[V], silicio
La ley de voltajes de Kirchhoff aplicada a la malla definida por el recorrido
Jc en la figura 8.31 da como resultado:
vcc = vCEQ + vREQ
vcc = vCEQ + RE iEQ (8.16)
8.3 Diseno de osciladores con forma de onda sinusoidal 475

R2

Q Jc CC
+


R1
Jb RE

Figura 8.31. Circuito equivalente en corriente directa.

La ley de voltajes de Kirchhoff aplicada a la malla definida por el recorrido


Jb en la figura 8.31 da como resultado:
vR1Q = vBEQ + vREQ
vR1Q = 0.7 + RE iEQ (8.17)
Suponga que se dan como datos los valores de iCQ , vCEQ , y vcc . Usando
(8.16) e iEQ ICQ se calcula el valor de RE . A continuacion se propone iR1Q
a partir de iCQ = iBQ y la siguiente consideracion importante:
iR1Q iBQ (8.18)
Entonces puede usarse (8.17) para calcular:
vR1Q
R1 = (8.19)
iR1Q
vcc vR1Q
R2 = (8.20)
iR1Q
El valor de los elementos L, C1 , C2 , C3 , CBP y Rt se calculan a partir del
analisis del circuito equivalente de senal pequena como se muestra en los
siguientes apartados.

Circuito equivalente de senal pequena

Primero se determina el modelo de senal pequena del transistor. Aunque


existen muchos modelos de senal pequena para el transistor (todos ellos correc-
tos) en esta obra se considera lo siguiente. La corriente de emisor, correspon-
diente al diodo en la union base-emisor, esta dada por la ecuacion de Shockley
[1], cap. 5:
476 8 Circuitos electronicos realimentados
h vBE i
iE = IES e VT 1 (8.21)

donde IES es una constante de valor entre 1012 [A] y 1016 [A] mientras
que VT = 0.026[V] para temperaturas de 300 grados Kelvin. Una relacion
importante del transistor indica que iB = (1 )iE , donde es una constante
positiva ligeramente menor que 1. Por tanto:
h vBE i
iB = (1 )IES e VT 1 (8.22)

Dado que se considera que el transistor opera en la region activa entonces se


puede despreciar el uno que se resta en la expresion anterior para escribir:
h vBE i
iB = (1 )IES e VT (8.23)

Recordando que iB = iBQ + ib y vBE = vBEQ + vbe se tiene:


v
BEQ +vbe
iBQ + ib = (1 )IES e VT
vBEQ vbe
= (1 )IES e VT
e VT (8.24)

Recuerdese que pequenos cambios en iB se deben a pequenos cambios en vBE ,


es decir, ib = 0 si vbe = 0. Entonces, de acuerdo a la expresion anterior se
obtiene:
h vBEQ i
iBQ = (1 )IES e VT

Por tanto, (8.24) se puede escribir como:


vbe
iBQ + ib = IBQ e VT (8.25)

Si solo se permiten valores pequenos de vbe se puede hacer la aproximacion


[4], pag. 942:
vbe vbe
e VT 1 +
VT
lo cual, junto con (8.25), implica que:

vbe VT
ib = , r = (8.26)
r IBQ

Por otro lado, la siguiente relacion tambien es valida para senal pequena:

ic = ib (8.27)
8.3 Diseno de osciladores con forma de onda sinusoidal 477
ib ic
B C
+
r ib

be ie

E
(a)
ie ic
E C

hib ib

be ib
+
B
(b)

Figura 8.32. Circuitos equivalentes de senal pequena del transistor.

Usando (8.26) y (8.27) se obtiene el modelo de senal pequena del transistor


que se muestra en la figura 8.32(a). Se puede encontrar una equivalencia entre
este modelo y el mostrado en la figura 8.32(b). Notese que la unica diferencia
radica en que el voltaje base-emisor ahora esta dado como una cada de voltaje
debida a la corriente de emisor. Por tanto, la diferencia debe depender del valor
de la nueva resistencia hib , es decir:

vbe = hib ie (8.28)

Comparando (8.26), (8.28), y aclarando que ie = (1 + )ib tambien se cumple,


se obtiene:
vbe vbe r VT VT
hib = = = = = (8.29)
ie (1 + )ib 1+ (1 + )IBQ IEQ

Notese que el valor de hib depende de IEQ , es decir, del punto de operacion.
Una vez que se cuenta con el modelo de senal pequena del transistor, se
procede a encontrar el circuito equivalente de senal pequena de todo el circuito
oscilador.
Considere el circuito de la figura 8.33(a). La ley de voltajes de Kirchhoff
aplicada a la malla representada por el recorrido J3 indica que:
diL
vcc = L + vCE + vRE
dt
478 8 Circuitos electronicos realimentados

n
J3
R L
R2

Q CC
C1
Rt
C3
CBP R1
RE C2

(a)
ib
ic C
J3
B
C1
ib hib ie E Rt
C3 L Rex Rcobre

RE C2

(b)

Figura 8.33. Obtencion del circuito de senal pequena para el circuito oscilador
completo.

iL = iLQ + il (8.30)
vCE = vCEQ + vce (8.31)
vRE = vREQ + vre (8.32)

Sustituyendo convenientemente, la expresion anterior se puede escribir como:


d
vcc = L (iLQ + il ) + vCEQ + vce + vREQ + vre
dt
diLQ
Usando (8.16) y vLQ = L dt = 0 en la expresion anterior se obtiene:

dil
0=L + vce + vre
dt
Por tanto, el circuito equivalente de senal pequena debe tener un trayecto
como el indicado por J3 en la figura 8.33(b). Procediendo de manera analoga
con cada una de las posibles mallas y nodos del circuito de la figura 8.33(a) se
encuentra que el circuito equivalente de senal pequena esta dado como en la
figura 8.33(b). Es importante aclarar que Rcobre es la resistencia equivalente en
8.3 Diseno de osciladores con forma de onda sinusoidal 479

paralelo de la resistencia interna (debida al cobre) de la inductancia, mientras


que Rex = n2 R donde R es la carga externa a la cual alimenta el circuito
oscilador y n es el cociente del numero de vueltas de L y el numero de vueltas
de la inductancia conectada a R.
Finalmente, las resistencias R1 y R2 en la figura 8.33(a) desaparecen en
la figura 8.33(b) porque se considera que la impedancia de CBP (en paralelo
con R1 y R2 ) es muy pequena comparada con el equivalente en paralelo de
R1 y R2 a la frecuencia de oscilacion 1 , es decir 1 C1BP RR11+R
R2
2
. Ademas,
1
si 1 CBP hib la impedancia del capacitor puede despreciarse.

Ecuaciones del sistema en lazo cerrado

En esta y en las subsecuentes secciones se analiza el circuito oscilador de la


figura 8.30 en base al circuito equivalente de senal pequena dado en la figura
8.33(b). Debe recordarse siempre que todo lo que predice este analisis solo
representa el comportamiento que las senales tienen al rededor del punto de
operacion el cual se determina mediante el analisis en corriente directa.

ib
ic C i
1
B ih
ib h ib E R t i out i out C1
C3 L R ex R cobre v o
ie
RE v out v out R in C2

Figura 8.34. Circuito usado para propositos de analisis.

Para propositos de analisis se abre el lazo de realimentacion que hay a


traves de la resistencia de emisor, tal como se muestra en la figura 8.34 [5],
pag. 265, [6], pag. 64. El valor de Rin en la figura 8.34 esta dado como:

RE hib
Rin = Rt + (8.33)
RE + hib
Ahora se procede a analizar el circuito de la figura 8.34. La impedancia entre
los puntos 1 y 2 esta dada como:

1 1 Rin sC1 2 sRin (C1 + C2 ) + 1


Zf (s) = = + = (8.34)
Yf (s) sC1 Rin + sC1 2 sC1 (sC2 Rin + 1)

donde Yf (s) es la admitancia entre los puntos 1 y 2. Por otro lado, Vo (s) e
I(s) se relacionan a traves de:
480 8 Circuitos electronicos realimentados

Vo (s) = Zc (s)I(s) (8.35)

donde:
1 1 1 1
= Yf (s) + + sC3 + + (8.36)
Zc (s) sL Rex Rcobre

Despues de algunas manipulaciones algebraicas se obtiene:

sL(sRin (C1 + C2 ) + 1)
Zc (s) = (8.37)
a3 s3 + a2 s2 + a1 s + 1
a3 = L(C1 C2 + C3 (C1 + C2 ))Rin
Rcobre + Rex
a2 = LC1 + LC3 + LRin (C1 + C2 )
Rcobre Rex
Rcobre + Rex
a1 = Rin (C1 + C2 ) + L
Rcobre Rex

El voltaje Vout (s) se puede calcular como:

Vout (s) = M (s)Vo (s) (8.38)

donde Vout (s) y Vo (s) se relacionan con la corriente Ih (s) mediante:


1 1
Vo (s) = Ih (s), Vout (s) = 1 Ih (s) (8.39)
Yf (s) Rin + sC2

Combinando ambas expresiones en (8.39) se obtiene:

1 1 + Rin sC2
Vo (s) = Vout (s)
Yf (s) Rin

Usando (8.34) se puede escribir:


2
Vout (s) s(Rin C1 C2 s + Rin C1 )
M (s) = = 2 (8.40)
Vo (s) Rin C2 (C1 + C2 )s2 + Rin (2C2 + C1 )s + 1

Utilizando sucesivamente (8.38) y (8.35) se encuentra:

Vout (s) 1 1
Iout (s) = = M (s)Vo (s) = M (s)Zc (s)I(s) (8.41)
Rin Rin Rin
Por otro lado, aplicando el divisor de corriente en el circuito de emisor de la
figura 8.34 se encuentra:
RE
Ie (s) = Iout (s)
RE + hib
Por tanto, si se cumple:
8.3 Diseno de osciladores con forma de onda sinusoidal 481

RE hib , 1 (8.42)

entonces se puede aproximar con buen nivel de exactitud:

Iout (s) Ie (s) = ( + 1)Ib (s) Ib (s) = I(s) (8.43)

es decir, la ganancia de corriente del transistor en la configuracion en base


comun es unitaria. Las expresiones en (8.41) y (8.43) dan origen al diagrama
de bloques de la figura 8.35(a). Este diagrama de bloques tiene realimentacion
positiva, lo cual es una caracterstica fundamental para producir oscilaciones
sostenidas. En la figura 8.35(b) se muestra un diagrama de bloques equiva-
lente que, sin embargo, ahora se expresa como un sistema con realimentacion
negativa. Esto permite la aplicacion de las herramientas de analisis y diseno
de la teora de control ya que todas ellas suponen sistemas en lazo cerrado
con realimentacion negativa como el mostrado en la figura 8.18(d). Por tanto,
la funcion de transferencia de lazo abierto es:
1
G(s)H(s) = M (s)Zc (s) (8.44)
Rin

0 I (s) Iout (s)


M (s )Z c(s )
R in
+ +

(a)

0 I (s) Iout (s)


M (s )Z c(s )
R in
+

(b)

Figura 8.35. Diagramas de bloques equivalentes del circuito en la figura 8.34.

Condiciones para conseguir oscilaciones sostenidas

Primero se estudian las caractersticas de las funciones de transferencia


M (s) y Zc (s). Notese que todos los coeficientes de estas funciones de trans-
ferencia son positivos. De acuerdo a los criterios vistos en las secciones 4.2.1
482 8 Circuitos electronicos realimentados

y 4.2.2 sobre el signo de los coeficientes de polinomios de primero y segundo


grado y sus correspondientes races, se concluye que M (s) tiene dos polos con
parte real negativa, un cero con parte real negativa y un cero en s = 0.
Sin embargo, de acuerdo a la seccion 4.2.3, el criterio de los signos de los
coeficientes no puede aplicarse a Zc (s) porque su denominador es un polinomio
de tercer grado. Sin embargo, se puede hacer uso de un resultado bien conocido
de la teora de circuitos electricos lineales. Este resultado afirma [7], cap. 19,
secciones 5 y 6, que la impedancia de cualquier red formada unicamente por
elementos pasivos (resistencias, capacitores e inductancias) es una funcion de
transferencia que solo tiene polos con parte real menor o igual a cero. Notese
que este es el caso de Zc (s). Mas aun, dado que Zc (s) tiene en su denominador
un termino independiente de s igual a la unidad, entonces se asegura que Zc (s)
tiene tres polos con parte real negativa, un cero con parte real negativa y un
cero en s = 0.
De acuerdo a lo anterior y a lo expuesto en el captulo 6 se concluye que
las graficas de Bode y polares de Zc (s) y M (s) tienen las formas mostradas
en las figuras 8.36 y 8.37, respectivamente, mientras que la grafica polar de
G(s)H(s) dada en (8.44) se muestra en la figura 8.38. Es conveniente subrayar
que la grafica polar de G(s)H(s) consiste en dos trayectorias cerradas que son
recorridas en sentido horario conforme la frecuencia vara de a +. El eje
real negativo es cruzado dos veces a las frecuencias = 1 . Notese que en
estos valores de frecuencia la funcion de transferencia G(j)H(j) tiene parte
imaginaria igual a cero. Finalmente, como G(s)H(s) tiene dos ceros en s = 0
para aplicar el criterio de Nyquist se debe hacer un rodeo como el mostrado
en la figura 6.44 alrededor de dichos ceros en el origen. Sin embargo, como
s = , con 0, entonces G(s)H(s) 0 sobre todo ese recorrido y es
representado por un unico punto en el origen. El uso del criterio de Nyquist
permite obtener las siguiente conclusiones:
Si |G(j)H(j)|=w1 < 1, entonces hay estabilidad de lazo cerrado por lo
que las oscilaciones no pueden sostenerse. Esto se debe a que Z = P + N ,
donde P = 0 representa el numero de polos inestables de G(s)H(s), N = 0
es el numero de vueltas horarias alrededor del punto (1, 0) en la figura
8.38 y Z = 0 es el numero de polos inestables de lazo cerrado.
Si |G(j)H(j)|=w1 > 1, entonces el sistema en lazo cerrado es inestable
porque Z = N + P = 2, con P = 0 y N = 2. Claramente, esta situacion
es indeseable.
Si |G(j)H(j)|=w1 = 1, entonces hay dos polos imaginarios puros por
lo que habra oscilaciones sostenidas. La parte imaginaria de estos polos es
igual a 1 y representa la frecuencia de oscilacion del circuito.
A partir de estas observaciones, a continuacion se presenta la manera de cal-
cular los elementos del circuito para asegurar que el circuito presentara osci-
laciones sostenidas. Sin embargo, dada la complejidad de las expresiones que
forman a G(s)H(s) se deberan introducir ciertas consideraciones sobre los
componentes del circuito.
8.3 Diseno de osciladores con forma de onda sinusoidal 483

dB
0 !

fase + 90
[grados] !
0
90
(a) Graficas de Bode de Zc (s)
Im (Z c(j!))

! =1
!=0
! =+1
Re (Z c(j!))

(b) Grafica polar de Zc (s) (dos vuel-


tas).

Figura 8.36. Graficas de respuesta en frecuencia de Zc (s) en (8.37).

Calculo de los componentes del circuito

Primero se obtiene la siguiente expresion:

1 2 C12 Rin 1 1
= + + +
Zc (j) (Rin (C1 + C2 ))2 + 1 Rex Rcobre

2 C2 Rin
2
(C1 + C2 ) + 1 1
+ j C1 + C3 (8.45)
(Rin (C1 + C2 ))2 + 1 L

al hacer el cambio de variable s = j en (8.36), y la siguiente expresion:


2
Rin 2 (C12 + C1 C2 ) + jRin C1
M (j) = 2 2 (C + C )2 (8.46)
1 + Rin 1 2

al hacer el cambio de variable s = j en (8.40). Con el fin de facilitar la ob-


tencion de esta expresion es importante indicar que, durante el procedimiento
484 8 Circuitos electronicos realimentados

dB
0 !

fase + 90
[grados] !
0
90
(a) Graficas de Bode de M (s).

Im (M(j!))

!=0 ! =+1
! =1
Re (M(j!))

(b) Grafica polar de M (s).

Figura 8.37. Graficas de respuesta en frecuencia de M (s) en (8.40).

Im (Z c(j!))

! = !1
! =+1

( 1; j0) ! = 1 ! = 0
Re (Z c(j!))

Figura 8.38. Grafica polar de G(s)H(s) en (8.44).


8.3 Diseno de osciladores con forma de onda sinusoidal 485

2
seguido, el factor 1 + Rin 2 C22 aparece en el numerador y el denominador de
M (j) por lo que se cancela para obtener finalmente (8.46).
Tal como se menciono previamente la grafica polar de G(j)H(j) cruza
el eje real negativo a la frecuencia 1 . Esto significa que las partes imaginarias
de (8.45) y (8.46) deben ser cero cuando se evaluan en = 1 . Aplicando esta
condicion a (8.45) se obtiene:
1
1 = r h i (8.47)
L CC11+C
C2
2
+ C3

que representa la frecuencia de oscilacion del circuito. Es muy importante


mencionar que, con el fin de simplificar las expresiones y obtener (8.47), se
deben hacer las siguientes suposiciones:

2 1 2 1
Rin , Rin (8.48)
12 C2 (C1 + C2 ) 12 (C1 + C2 )2

Por otro lado, la fase de (8.46) esta dada como:


1
!
(C1 +C2 )
M (j) = arctan (8.49)
Rin

Notese que esta fase es diferente de cero para cualquier valor de frecuencia.
La condicion mencionada previamente que requiere que la parte imaginaria
de M (j) sea cero es equivalente a requerir que la fase en (8.49) sea cero.
Aunque esto no es posible, sin embargo puede obtenerse una fase cercana a
cero para = 1 si:
1
Rin (8.50)
1 (C1 + C2 )

Esta y las otras aproximaciones que se han hecho solo resultaran en pequenas
diferencias entre los valores calculados y los obtenidos experimentalmente de
la frecuencia de oscilacion y la ganancia de la funcion de transferencia de lazo
abierto.
Finalmente, el valor de G(j)H(j)|=w1 se obtiene como:
1
|G(j)H(j)|=w1 = Re(M (j))|=1 Re(Zc (j))|=1 (8.51)
Rin

donde Re(x) representa la parte real de x. A partir de (8.51) y tomando en


cuenta la suposicion (8.50) se encuentra:

1 1
|G(j)H(j)|=w1 =
Rin C1C+C 2 C12
2 + 1
+ 1
1 Rin (C1 +C2 ) Rex Rcobre
486 8 Circuitos electronicos realimentados

Por tanto, de acuerdo a la condicion |G(j)H(j)|=w1 = 1 se concluye que


el circuito oscilara de manera sostenida a la frecuencia dada en (8.47) si:

1 1 =1 (8.52)
Rin C1C+C 2 C12
2 + 1
+ 1
1 Rin (C1 +C2 ) Rex Rcobre

Al igual que en el caso del oscilador basado en amplificador operacional, es


importante subrayar lo siguiente. En la practica no es posible satisfacer la
condicion (8.52) debido a las incertidumbres que existen en los valores de
los componentes involucrados en dicha condicion. Ademas, estos parametros
pueden cambiar durante la operacion del circuito. La manera de resolver este
problema en la practica es utilizar la siguiente condicion en lugar de (8.52):

1 1 >1 (8.53)
Rin C1C+C 2 C12
2 + 1
+ 1
1 Rin (C1 +C2 ) Rex Rcobre

Esto hace que al encender el circuito este sea inestable por lo que sus oscilacio-
nes incrementaran su amplitud rapidamente. Sin embargo, este crecimiento en
la amplitud de las oscilaciones no se mantendra de manera indefinida debido
a que, antes de que esto suceda, el transistor alcanzara las regiones de satura-
cion (voltaje de colector a emisor cero) y de corte (corriente de colector cero).
Por tanto, la relacion entre Iout e I en la figura 8.35(b) realmente esta deter-
minada por una funcion saturacion como I = sat(Iout ) mostrada en la figura
8.39. La ganancia de corriente del transistor corresponde a la pendiente de
sat(Iout ), es decir, a dsat(I
dIout
out )
que depende de la amplitud de Iout . Por tanto,
el diagrama de bloques de la figura 8.35(b) debe ser cambiado por el de la
figura 8.40 y ahora se tiene que:

dsat(Iout ) 1 1
G(j)H(j)|=w1 =
dIout Rin C1C+C2 C12
2 +
1
+ 1
1 Rin (C1 +C2 ) Rex Rcobre
(8.54)

Notese que la pendiente dsat(I out )


dIout es igual a la unidad para valores de Iout
cercanos a cero pero disminuye hacia cero conforme Iout se aleja de cero. Por
tanto, si se satisface (8.53), siempre existe una amplitud de las oscilaciones
para la cual el valor dado en (8.54) se convierte en la unidad y se consiguen las
oscilaciones sostenidas que se desean. Aunque esto sugiere que se puede disenar
el valor del lado izquierdo de (8.53) tan grande como se desee, sin embargo
no es recomendable hacer esto y se debe disenar, en cambio, un valor cercano
a la unidad. La razon de esto es que valores muy grandes del lado izquierdo
de (8.53) requieren que se reduzca fuertemente la ganancia de corriente lo
cual implica que el circuito trabaje en una zona fuertemente no lineal y, como
consecuencia, la forma de onda sinusoidal sufrira fuertes deformaciones.
8.3 Diseno de osciladores con forma de onda sinusoidal 487

I = sat(Iout)

1
1 Iout

Figura 8.39. Caracterstica real entre la corriente de emisor y la corriente de co-


lector en un transistor.

0 I (s) Iout (s)


M (s )Z c(s )
R in
+

dsat (I ou t )
dI ou t

Figura 8.40. Diagrama de bloques que considera la saturacion en la corriente de


colector.

Es importante subrayar la diferencia entre lo que sucede en un transistor


y lo que sucede en un amplificador operacional. En un transistor aparece una
funcion saturacion suave sat(Iout ) como resultado de la naturaleza no lineal
del transistor: la ganancia de corriente del transistor disminuye poco a poco al
incrementarse la amplitud de las oscilaciones. Por el contrario, un amplifica-
dor operacional es un dispositivo completamente lineal y su modelo no cambia
al crecer las amplitudes. Por ejemplo, considere el amplificador realimentado
R +R
de la figura 8.41, el cual tiene ganancia 1R1 f . Cuando se alcanza el voltaje
de saturacion de salida del amplificador operacional se obtiene una saturacion
dura como la mostrada en la figura 8.42. Esto significa que no hay una dismi-
nucion progresiva de la ganancia del amplificador operacional realimentado,
R +R
sino que hay un cambio abrupto de 1R1 f a cero. Por tanto, no existe una
ganancia intermedia que asegure que la magnitud de la funcion de lazo abierto
dada en (8.6) sea igual a la unidad. Esta es la razon de porque debe recurrirse
R +R
a un ajuste artificial de la ganancia 1R1 f usando el truco de los diodos zener
que se muestra en la figura 8.21.
488 8 Circuitos electronicos realimentados

ei
eo

Rf
R1

Figura 8.41. Amplificador lineal.

eo

+ V sat
R f+R 1
R1

ei

V sat

Figura 8.42. Saturacion dura en un amplificador operacional.

Por otro lado, notese que las condiciones (8.48), (8.50) se cumplen automati-
camente si se satisface:
1
Rin (8.55)
1 C2

Las condiciones (8.42) y (8.55) son importantes para diseno como se explica
a continuacion. La primera de estas condiciones asegura que la ganancia de
corriente de la configuracion base comun sea unitaria mientras que la segunda
asegura que el capacitor C2 no sea puesto en corto circuito por la resistencia
Rin pues si as fuera no funcionara correctamente la realimentacion a traves
de la red capacitiva formada por C1 y C2 . Notese tambien que la expresion
entre corchetes en (8.53) representa la resistencia en paralelo de Rex , Rcobre y
Rin multiplicada por el factor constante [(C1 +C2 )/C1 ]2 . Normalmente Rin es
pequena comparada con Rex y Rcobre . Si el factor (C1 + C2 )/C1 se selecciona
grande mediante:

C2 10C1 (8.56)
8.3 Diseno de osciladores con forma de onda sinusoidal 489

entonces se asegura que el valor del factor entre corchetes en (8.53) es apro-
ximadamente la resistencia equivalente de Rex y Rcobre en paralelo. Entonces
el lado izquierdo de (8.53) esta dado por el valor de esta resistencia equiva-
lente en paralelo (que es muy grande comparada con Rin ) dividido entre el
factor Rin (C1 + C2 )/C1 . Por tanto, si se usa (8.56) se puede conseguir que
este cociente sea tan solo un poco mayor que la unidad. Por tanto, las reglas
de diseno del oscilador se resumen en (8.42), (8.55), (8.56), (8.47) y (8.53). Es
interesante mencionar que estas condiciones son las que aparecen en los libros
que tratan sobre el diseno electronico de este tipo de osciladores [6], pag. 65,
[8], pag. 9-13.
Finalmente, es interesante resaltar las ventajas que en este problema tiene
el enfoque basado en la respuesta en frecuencia respecto del enfoque basado a
la respuesta en el tiempo (el estudio de la ubicacion de los polos del sistema en
lazo cerrado). Si se intenta aplicar el segundo de estos metodos se encuentra un
polinomio caracterstico de grado cinco. Al intentar usar el criterio de Routh
para establecer las condiciones en las que hay polos imaginarios puros de lazo
cerrado se encuentra un gran problema: las condiciones resultantes quedan
expresadas de manera muy complicada y es muy difcil encontrar reglas de
diseno claras como las indicadas en (8.42), (8.47), (8.53), (8.55), (8.56).

Resultados experimentales

A continuacion se disena un circuito que genera una onda sinusoidal de


1.8 [MHz]. Los datos de diseno son los siguientes. vCC = 12[V], iEQ iCQ =
1.3[mA], vCEQ = 10.7[V].
Se selecciona un transistor PN2222A que cuenta con un valor de = 200.
Usando (8.16) se encuentra:

RE = 1[KOhm]

A partir de iCQ = iBQ se encuentra que iBQ = 6.5 103 [mA]. Por tanto,
de acuerdo a (8.18) se propone iR1Q = 1[mA]. Con esto y (8.17), (8.19), (8.20)
se calcula:

R1 = 2[KOhm], R2 = 10[KOhm]

Se cuenta con una inductancia de valor L = 0.328103 [Hy], con una resisten-
cia interna en paralelo Rcobre = 101677[Ohm], capacitores C1 = 271012 [F],
C2 = 200 1012 [F] y se supondra que no existe el capacitor C3 , es decir, que
C3 = 0. Notese que esta seleccion de capacitores satisface aproximadamente
(8.56). Por tanto, usando (8.47) se encuentra que la frecuencia de oscilacion
del circuito es f1 = 1.8018[MHz], es decir 1 = 2f1 = 1.132 107 [rad/s].
Por otro lado, tambien se supondra que el oscilador no alimenta ninguna
carga externa lo cual significa que Rex , es decir 1/Rex = 0. Usando
Rt = 10000[Ohm], VT = 0.026[V], iEQ = 1.3[mA], (8.29) y (8.33) se encuentra
Rin = 10020[Ohm]. Con estos datos se obtiene:
490 8 Circuitos electronicos realimentados

1 1 = 1.1363
Rin C1C+C 2 C12
+ 1
+ 1
1 Rin (C1 +C2 )2 Rex Rcobre

es decir, se satisface (8.53) ademas de (8.55) y (8.42). Por otro lado, se usa un
valor de CBP = 0.1 106 [F], por lo que 1 C1BP = 0.883[Ohm] RR11+R R2
2
=
1666[Ohm]. Ademas, 0.883[Ohm] hib = 20[Ohm]. Por tanto, se cumplen to-
das las condiciones de diseno establecidas en el apartado anterior. En la figura
8.43 se muestran las variaciones de voltaje vo medidas entre las terminales de
la inductancia. La frecuencia medida en este experimento es de 1.388[MHz].

Figura 8.43. Forma de onda obtenida con Rt = 10000[Ohm].

Figura 8.44. Forma de onda obtenida con Rt = 11000[Ohm].


8.3 Diseno de osciladores con forma de onda sinusoidal 491

En la figura 8.44 se muestran las variaciones de vo cuando se utiliza un


valor de Rt = 11000[Ohm], con lo cual se obtiene:

1 1 = 1.0460 (8.57)
Rin C1C+C 2 C12
2 + 1
+ 1
1 Rin (C1 +C2 ) Rex Rcobre

Esto significa que la ganancia de lazo disminuye. Notese que al tener una
ganancia de lazo menor se requieren oscilaciones menos amplias y, por tanto,
una incursion menor de la senal dentro de la region no lineal del transistor para
conseguir la ganancia de lazo unitaria que asegura las oscilaciones sostenidas.
La mayor amplitud de las oscilaciones en el caso de la figura 8.43, cuando se
usa Rt = 10000[Ohm], tambien se explica de esta manera. De hecho, puede
alcanzarse a apreciar una ligera distorsion en la parte inferior de la onda
sinusoidal en el caso cuando se usa Rt = 10000[Ohm].
Finalmente, en las figuras 8.45(a), 8.45(b) y 8.46(a) se muestran, respec-
tivamente, las graficas polares de M (s), Zc (s) y G(s)H(s) obtenidas con los
valores numericos mencionados y Rt = 11000[Ohm]. Notese el parecido entre
las figuras 8.45(a) y 8.37(b) as como entre las figuras 8.45(b) y 8.36(b). Por
otro lado, las figuras 8.38 y 8.46(a) tambien son muy parecidas. La aparente
diferencia a frecuencias cercanas a cero se debe a que dicha parte no se alcanza
a apreciar en la figura 8.46(a) porque ocurre a frecuencias muy bajas. Esto se
verifica en la figura 8.46(b) donde se presenta un acercamiento en dicha parte
de la figura 8.46(a) y se alcanza a apreciar la parte de la grafica polar a la
cual el eje real positivo es tangente en la figura 8.38. En la figura 8.46(a) se
puede apreciar que se cumple (8.57).
492 8 Circuitos electronicos realimentados
Nyquist Diagram
0.1

0.08

0.06

0.04

System: M
Real: 0.119
0.02 Imag: 0.0047

Imaginary Axis
Frequency (rad/sec): 1.2e+007

0
! = 0
!= 1
-0.02

-0.04

-0.06

-0.08

-0.1
-0.05 0 0.05 0.1 0.15
Real Axis

(a) M (s)

!= 1
! =0
!= +1

(b) Zc (s)

Figura 8.45. Graficas polares usando los valores numericos del circuito construido
experimentalmente.
8.3 Diseno de osciladores con forma de onda sinusoidal 493
Nyquist Diagram
1

0.8

0.6

0.4

System: GH
0.2 Real: -1.04
Imag: 0.00332

Imaginary Axis
Frequency (rad/sec): -1.13e+007
0
! = 0; 1

-0.2

-0.4

-0.6

-0.8

-1
-1.2 -1 -0.8 -0.6 -0.4 -0.2 0 0.2
Real Axis

(a) G(s)H(s)
Nyquist Diagram
0.01

0.008

0.006

0.004

0.002
Imaginary Axis

0.002

0.004

0.006

0.008

0.01
0.01 0.008 0.006 0.004 0.002 0 0.002 0.004 0.006 0.008 0.01
Real Axis

(b) G(s)H(s) (acercamiento)

Figura 8.46. Graficas polares usando los valores numericos del circuito construido
experimentalmente (cont.).
494 8 Circuitos electronicos realimentados

8.4. Resumen del captulo


En este captulo se ha mostrado como reducir la distorsion producida por
circuitos electronicos no lineales, construir controladores analogicos usando
circuitos electronicos realimentados y disenar y construir circuitos osciladores
con forma de onda sinusoidal. La herramienta fundamental para resolver estos
problemas es la teora de control clasico, que incluye la respuesta en el tiempo
y la respuesta en frecuencia.
En el caso de reducir la distorsion producida por circuitos electronicos
no lineales, la idea fundamental es el uso de la funcion de transferencia de
sistema en lazo cerrado C(s) G(s)
R(s) = 1+G(s)H(s) . La solucion no incluye ningun
analisis de estabilidad ya que se considera que los circuitos involucrados no
tienen dinamica, es decir, que se pueden modelar como simples ganancias
(posiblemente no lineales) y no como ecuaciones diferenciales.
En el caso de la construccion de controladores analogicos es importante
seleccionar el amplificador operacional mas adecuado para cada aplicacion. En
particular, se debe recordar que la ganancia de lazo abierto del amplificador
operacional (denominada A0 en el presente captulo) en realidad no es una
constante sino que vara con la frecuencia a manera de un filtro pasa bajas.
Esto significa que si la planta a controlar funciona a altas frecuencias (lo cual
depende de la rapidez de la misma planta) entonces el valor de A0 puede
verse reducido a esa frecuencia. Por tanto, se debera usar un amplificador
operacional que tenga un ancho de banda adecuado.
Finalmente, en el caso de los circuitos osciladores, es de fundamental im-
portancia el concepto de estabilidad marginal. Por tanto, los componentes del
circuito se deben seleccionar de manera que se alcance esta caracterstica de
funcionamiento. Las herramientas fundamentales para analizar y disenar estos
circuitos son la tecnica de la respuesta en el tiempo (ubicacion de los polos de
lazo cerrado), en el caso de circuitos basados en amplificadores operacionales,
y la tecnica de la respuesta en frecuencia (criterio de estabilidad de Nyquist),
en el caso de circuitos basados en transistores.

8.5. Preguntas de repaso


1. Cuando se dice que un sistema es marginalmente estable? Por que es
importante este concepto para construir circuitos osciladores?
2. Por que se dice que no se puede construir un buen oscilador usando un
circuito electronico completamente lineal? Por que un circuito electronico
no lineal resuelve el problema?
3. Un transistor es un dispositivo electronico no lineal, entonces Por que se
usan tecnicas de control lineal (funcion de transferencia y respuesta en
frecuencia) para disenar circuitos osciladores basados en transistores?
8.5 Preguntas de repaso 495

4. Por que se necesita usar diodos zener en los osciladores basados en am-
plificadores operacionales? Por que no se usan diodos zener en los osci-
ladores basados en transistores?
5. Que es un modelo de senal pequena para un transistor?
6. Por que cree que los circuitos osciladores sean sistemas con realimenta-
cion positiva?
7. Explique el mecanismo mediante el cual es posible reducir, usando reali-
mentacion, la distorsion producida por circuitos electronicos no lineales.
8. Por que se debe disenar un circuito oscilador de manera que sea ligera-
mente inestable?
9. Que opina de la siguiente afirmacion? La funcion de transferencia de lazo
abierto de un circuito oscilador es un filtro pasa banda.
10. De acuerdo a la pregunta anterior, Que determina la frecuencia de osci-
lacion?
Referencias

1. A.R. Hambley, Electronics. A top-down approach to computer-aided circuit de-


sign, Macmillan Publishing Company, New York, 1994.
2. R.F. Coughlin and F. F. Driscoll, Amplificadores operacionales y circuitos inte-
grados lineales, 4a. edicion, Prentice Hall Hispanoamericana, Mexico, 1993.
3. N.S. Nise, Sistemas de control para ingeniera, 1a. edicion en espanol, 1a. Re-
impresion, CECSA, Mexico, 2004.
4. M. Alonso and E.J. Finn, Fsica, Addison-Wesley Iberoamericana, Wilmington,
Delaware, 1995.
5. W. Hayward, Introduction to radio frequency design, The American Radio Relay
League Inc., 1994.
6. P. H. Young, Electronic communication techniques, Merrill Publishing Company,
1990.
7. C.A. Desoer and E.S. Kuh, Basic circuit theory, International Student Edition,
McGraw-Hill, Tokyo, 13th printing 1983.
8. M. Kaufman y A.H. Seidman, Manual para ingenieros y tecnicos en electronica,
McGraw-Hill, Mexico, 1987.
9
Control de velocidad de un motor de CD

R L
+ i + T T c n1
u ea Jm bL
Tp
bm JL
n2 T L
Figura 9.1. Motor de CD con carga.

El problema del control de velocidad de un motor de CD es quiza uno


de los mas sencillos debido a que el modelo de la planta a controlar es de
primer orden y a que, dada la disponibilidad de motores de CD comerciales
de diferentes capacidades, casi no es necesaria la construccion adicional de
partes mecanicas. Por otro lado, los sistemas de control de velocidad tienen
diversas e importantes aplicaciones en la industria que van desde las bandas
transportadoras hasta los procesos de aplanado de laminas metalicas usando
rodillos. Finalmente, otra razon para incluir este problema de control en la
presente obra es el hecho de que otros procesos de diferente naturaleza, como
los sistemas de control de temperatura y los sistemas de control de nivel,
pueden controlarse de manera similar (usando controladores proporcional-
integral) ya que sus modelos tienen la misma estructura.
500 9 Control de velocidad de un motor de CD

Objetivos del captulo

Construir controladores tipo proporcional-integral usando un microcontro-


lador.
Construir la totalidad de las interfases electronicas necesarias para cons-
truir el sistema de control completo.
Identificar las ventajas y desventajas de los controladores proporcional-
integral.
Aplicar a una situacion experimental los conceptos de la teora de control
clasico.
Un motor electrico es un dispositivo que es utilizado para proveer movi-
miento a un sistema mecanico. Existen muchos tipos de motores electricos: de
induccion [1], caps. 10 y 11, de paso a paso [2], sncronos [3], de reluctancia
variable [4], de CD con escobillas y sin escobillas [5], cap. 10, etc. Sin embargo,
el motor de corriente directa (CD) con escobillas y con iman permanente es el
mas sencillo de controlar. Mas aun, dado que su modelo matematico es lineal
y de una entrada-una salida, es el motor ideal para ser usado como prototipo
experimental durante las etapas iniciales de aprendizaje en control automati-
co. En este captulo se estudia el control de velocidad de un motor de CD
con escobillas y con iman permanente. En el proximo captulo se estudia el
control de posicion de este mismo tipo de motor.

9.1. Modelo matematico


En la figura 9.1 se muestra un motor de CD con escobillas y con iman
permanente que mueve a una carga a traves de una caja de engranes. La
nomenclatura utilizada es la siguiente.

u es el voltaje aplicado en las terminales de armadura del motor.


i es la corriente electrica de armadura.
es la posicion angular del rotor del motor.
es la posicion angular de la carga.
ea = ke es la fuerza contra-electromotriz, donde ke es la constante de
fuerza contra-electromotriz.
T = km i es el par electromagnetico generado, donde km es la constante de
par del motor.
Tc es el par equivalente de la carga reflejado sobre la flecha del motor. Este
par se opone al movimiento del motor (sentido contrario a ).
TL es el par aplicado (por el motor) sobre la carga.
Tp es un par de perturbacion que se aplica desde el exterior. Se supone
que este par se opone al movimiento de la carga (sentido contrario a ). Si
no es as todo es cuestion de considerar que Tp es negativo.
L es la inductancia de armadura.
9.1 Modelo matematico 501

R es la resistencia de armadura.
Jm es la inercia del rotor del motor.
bm es la constante de friccion viscosa del motor.
JL es la inercia de la carga.
bL es la constante de friccion viscosa de la carga.
n1 y n2 representan el numero de dientes del engrane del eje del motor y
del eje de la carga, respectivamente.

Notese que un motor de CD es un sistema electromecanico compuesto por


un subsistema electrico y un subsistema mecanico. El modelo matematico
correspondiente se encuentra modelando por separado cada uno de estos sub-
sistemas para luego unirlos. A continuacion se obtiene el modelo de cada una
de estas partes.

Modelo del subsistema electrico del motor

Aplicando la Ley de Kirchhoff de voltajes (vease la figura 9.1) se tiene:


X
voltaje aplicado = cadas de voltaje en la malla
u = cada en la inductancia + cada en la resistencia +
+fuerza contraelectromotriz
di
u=L + R i + ea (9.1)
dt
donde, de acuerdo a (2.38) en el captulo 2, la fuerza contraelectromotriz
esta dada como:

ea = ke

y el punto representa la primera derivada respecto al tiempo.

Modelo del subsistema mecanico del motor

En esta parte debe usarse la Segunda Ley de Newton. Como existen dos
cuerpos diferentes debe aplicarse la Segunda Ley de Newton a cada uno de
estos cuerpos por separado.

Modelo del rotor

X
inercia aceleracion angular = pares sobre la inercia Jm
Jm = par generado par de friccion par de carga
Jm = T bm Tc (9.2)
502 9 Control de velocidad de un motor de CD

donde, de acuerdo a (2.39) en el captulo 2, el par electromagnetico generado


esta dado como:

T = km i

La suma en el miembro derecho de (9.2) es una suma vectorial por lo que el


signo indica el sentido en que se aplican los pares. Un signo negativo indica
que dicho par se opone al movimiento de la inercia Jm mientras que un signo
positivo indica que dicho par favorece el movimiento de la inercia Jm .

Modelo de la carga

Dada la presencia de una caja de engranes, es necesario utilizar (2.32) y


(2.33), vistas en el captulo 2, para concluir que:
n2
= n , n= (9.3)
n1
TL = n T c (9.4)

donde n1 y n2 representan, respectivamente, el numero de dientes del engrane


unido al eje del motor y al eje de la carga. Aplicando la Segunda Ley de
Newton a la carga:
X
inercia aceleracion angular = pares sobre la inercia JL
JL = TL bL Tp (9.5)

Usando (9.2), (9.5), (9.3) y (9.4) se obtiene el modelo combinado del motor
de CD y la carga como:
1
Jm = km i bm TL
n
1
Jm = km i bm JL + bL + Tp
n
1
n Jm = km i bm n JL + bL + Tp
n
2
2

n Jm + JL + n bm + bL = n km i T p (9.6)

Si se define:
J = n2 Jm + JL , b = n2 bm + bL (9.7)
entonces se puede escribir (9.6) como:

J + b = n km i Tp (9.8)

Finalmente, el modelo matematico del motor completo esta dado por (9.1) y
(9.8), es decir:
9.2 Amplificador de potencia 503

di
L = u R i n ke (9.9)
dt
J = b + n km i Tp (9.10)

Notese que la ecuacion diferencial en (9.10) es identica a la presentada en


(2.92) correspondiente al sistema mostrado en la figura 2.28(a) de captulo 2.
Las unicas diferencias se deben a que (2.92) se deja expresada en terminos del
par externo aplicado (igual a km i en un motor de CD) y que en (2.92) no se
considera ningun par externo sobre el cuerpo 2 (Tp = 0).
Las ecuaciones diferenciales (9.9) y (9.10) representan el modelo matemati-
co del conjunto motor de CD-carga porque si se conocen todas las constantes
as como el voltaje de armadura aplicado, u, se puede resolver la ecuacion di-
ferencial para calcular la posicion de la carga, , como una funcion del tiempo.
Aplicando la transformada de Laplace a las ecuaciones (9.9) y (9.10) conside-
rando todas las condiciones iniciales iguales a cero se encuentra:
1
I(s) = [U (s) n ke s(s)] (9.11)
sL + R
1
(s) = 2 [n km I(s) Tp (s)] (9.12)
s J + sb
donde I(s), U (s), (s), Tp (s) representan las transformadas de Laplace de i,
u, y Tp , respectivamente.

9.2. Amplificador de potencia


Es importante subrayar la necesidad de usar un amplificador de potencia.
Un sistema de control se puede dividir en dos partes: i) la parte de control y
ii) la parte de potencia. La parte de control incluye a toda la parte electronica
encargada de procesar la informacion (sensores y algoritmos de control) que
es utilizada para determinar cual es la orden que debe ser enviada al proceso
a controlar. Esta tarea requiere de circuitos precisos que funcionan utilizando
niveles bajos de corriente, es decir, procesan informacion pero no procesan
niveles importantes de potencia por lo que las ordenes que envan son debiles.
Sin embargo, estas ordenes deben ser capaces de producir cambios importan-
tes en la entrada del proceso a controlar y generalmente la entrada del proceso
maneja niveles importantes de potencia para poder producir los cambios es-
perados en el proceso. Esta es la razon de incluir la etapa de potencia en un
sistema de control. La etapa de potencia normalmente consiste de un ampli-
ficador de potencia que a su entrada recibe la debil senal entregada por el
controlador (senal de control) y a su salida entrega una senal de alta potencia
que se aplica directamente a los actuadores colocados en la entrada del pro-
ceso a controlar. Por ejemplo, en los sistemas electromecanicos los actuadores
utilizados son motores electricos que son equipos capaces de transformar una
senal electrica en la fuerza o el par que necesita el mecanismo para realizar el
504 9 Control de velocidad de un motor de CD

movimiento deseado. La senal de control es una senal electrica debil entrega-


da por el controlador (computadora, microcontrolador o circuitos electronicos
analogicos) mientras que un motor electrico necesita una senal de gran poten-
cia para producir la fuerza requerida. As, el amplificador de potencia utilizado
se debe colocar entre la senal entregada por el controlador y la senal aplicada
al motor electrico. De acuerdo a esto, un amplificador de potencia se puede
modelar como una ganancia Ap que relaciona al voltaje recibido en su entrada
ui (senal de control) con el voltaje entregado en su salida u (en las terminales
de armadura del motor):

u = Ap ui (9.13)

9.3. Control de corriente

Una tecnica de control para motores electricos que es muy usada en la


industria [5], pag. 76, [6], [7], consiste en colocar un lazo interno de corriente.
En su forma mas sencilla este lazo consiste en un controlador proporcional de
corriente. Esto significa que la senal de control se calcula como:

ui = K(i i) (9.14)

donde K es una constante positiva que representa la ganancia del controlador


proporcional de corriente mientras que i representa la consigna de corriente
que debe ser obtenida como la salida de otro controlador (lazo externo) que se
encarga de controlar la variable deseada, es decir, la velocidad o la posicion.
Mas adelante se explicara como se disena dicho lazo externo de control. Por
lo pronto supongase que i es simplemente el valor deseado de corriente que
sera especificado de algun modo. Usando (9.13) y (9.14) se encuentra que el
voltaje aplicado en las terminales de armadura del motor de CD esta dado
como:

u = Ap K(i i) (9.15)

Aplicando la transformada de Laplace a (9.15) se encuentra:

U (s) = Ap K(I (s) I(s)) (9.16)

donde I (s) es la transformada de Laplace de i . Combinando (9.11), (9.12) y


(9.16) se obtiene el diagrama de bloques de la figura 9.2(a). Como se muestra
en el ejemplo 4.4 de la seccion 4.1 a partir de la figura 9.2(a) se pueden
hacer las simplificaciones mostradas en las figuras 9.2(b) y 9.2(c). Tambien se
muestra en el ejemplo 4.4 de la seccion 4.1 que, a partir de la figura 9.2(c), se
puede escribir:

(s) = G1 (s)I (s) + G2 (s)Tp (s) (9.17)


9.3 Control de corriente 505
U i ( s) T p ( s)

I (s) + U ( s) 1 I(s) + 1 ( s)
K Ap nkm
+ Ls+R Js 2 +bs

nke s

(a)
T p ( s)
I (s) + (s)
+ 1 I(s) + 1
KAp nkm
Ls+R Js 2 +bs

nke
KA p
s
(b)
T p ( s)

I (s) + KA p I(s) + 1 (s)
nkm
Ls+R+KA p Js 2 +bs

nke
KA p
s

(c)
T p ( s)

I (s) + ( s)
1
nkm Js 2 +bs

(d)

Figura 9.2. Diagramas de bloques equivalentes para un motor de CD con un lazo


proporcional de corriente y un amplificador de potencia.

donde:
nkm
G1 (s) = h
2k k
i (9.18)
sL+R
KAp + 1 (sJ + b) + nKAm e
p
s

sL+R
KAp + 1
G2 (s) = h 2k k
i (9.19)
sL+R
KAp + 1 (sJ + b) + nKAm e
p
s
506 9 Control de velocidad de un motor de CD

Si la ganancia K se selecciona suficientemente grande entonces se puede con-


siderar que [5], pag. 76:

sL + R n2 km ke
0, 0
KAp KAp
para aproximar (9.18) y (9.19) como:
nkm
G1 (s) = (9.20)
s2 J + sb
1
G2 (s) = 2 (9.21)
s J + bs
Usando (9.20) y (9.21) en (9.17) se obtiene:
1
(s) = [nkm I (s) Tp (s)] (9.22)
s2 J + sb
lo cual se representa usando un diagrama de bloques en la figura 9.2(d). Notese
que el objetivo del control de corriente mostrado en (9.15) es hacer desprecia-
ble la dinamica electrica del motor de manera que el modelo del motor ahora
solo esta representado por la parte mecanica del mismo. Esto puede apreciarse
claramente si se comparan (9.22) y (9.12). Estas dos expresiones indican que
ahora puede considerarse que es la corriente la que se utiliza como variable
de control y no el voltaje como se indicaba en (9.11). Es claro que el voltaje
sigue siendo la variable que se manipula directamente como lo indica (9.15),
sin embargo, para propositos de analisis y diseno del sistema de control se
puede suponer que es la corriente la que se manipula directamente a traves
de la consigna de corriente i . El proposito del control de corriente (9.15) es
conseguir que el valor actual de la corriente i siga de cerca a la consigna i
para lo cual es muy conveniente usar un valor grande de la ganancia K. Notese
que la expresion en (9.22) se puede reescribir como se muestra a continuacion:
1 1
(s) = [kI (s) Tp (s)] (9.23)
s(s + a) J
b nkm
a= , k=
J J
Finalmente, dado que la velocidad y la posicion se relacionan a traves de
= d
dt , entonces usando la transformada de Laplace con condiciones iniciales
cero se tiene que (s) = s(s). Por tanto, la expresion en (9.23) se puede
reescribir como:
1 1
(s) = s(s) = [kI (s) Tp (s)] (9.24)
s+a J
En lo que resta de este captulo se utilizara el modelo dado en (9.24) para
disenar controladores de velocidad. Tambien se presentaran algunos resultados
experimentales obtenidos con dichos controladores.
9.4 Identificacion 507

9.4. Identificacion
En esta seccion es de interes realizar un experimento que permita conocer
los valores de las constantes k y a del modelo en (9.24). A continuacion se
explica la manera de disenar dicho experimento.
Suponga que no hay ninguna perturbacion externa aplicada, es decir
Tp (s) = 0, por lo que el modelo (9.24) se reduce a:

k
(s) = I (s) (9.25)
s+a
Este es un sistema de primer orden como el estudiado en la seccion 3.1. Por
tanto, si se aplica el valor constante i = A, es decir I (s) = As , entonces la
velocidad evolucionara en el tiempo como se muestra en la figura 9.3, es
decir:

!(t)

kA
a

0:632 kA
a


tiempo

Figura 9.3. Evolucion de la velocidad de un motor de CD cuando se aplica un valor


constate i = A.

kA
(t) = 1 eat (9.26)
a
La constante de tiempo se puede medir como se muestra en la figura 9.3
y sabiendo que = a1 , se puede calcular el valor del parametro a. Por otro
508 9 Control de velocidad de un motor de CD

lado, definiendo el valor final de velocidad como f = lmt (t) = kA a y


a
conociendo el valor de a, se puede calcular k = Af .
En la figura 9.4 se presentan los resultados obtenidos al realizar el experi-
mento descrito en el procedimiento anterior. El ruido contenido en la medicion
de velocidad es evidencia de un hecho bien conocido en sistemas de control:
la velocidad es una senal ruidosa. Vease la seccion 9.6 para una explicacion
de porque se mide en volts. Se utiliza un valor i = A = 0.3[A] y midiendo
directamente en la figura 9.4 se encuentran los valores:

= 2.7[s], f = 2[V] (9.27)

Estas mediciones se simplifican y al mismo tiempo se hacen mas exactas si


se utiliza un programa de computadora para realizarlas. Con estos valores se
sigue el procedimiento indicado previamente para encontrar que:

a = 0.3704, k = 2.4691 (9.28)

Finalmente, es importante aclarar que no es de interes calcular el valor del


factor 1/J que aparece como coeficiente de la perturbacion Tp (s) en (9.24).
La razon de esto es que normalmente incluso el valor de Tp no es conocido y
a pesar de ello su efecto puede ser compensado.

!
[V]

0:632 2


= 2:7 tiempo [s]

Figura 9.4. Identificacion experimental de un motor de CD.


9.5 Control de velocidad 509

9.5. Control de velocidad


El diseno de un controlador tiene como objetivo asegurar que en lazo cerra-
do se consigan las caractersticas deseadas de respuesta transitoria y en estado
estacionario. Las caractersticas de respuesta transitoria se refieren a la cons-
tante de tiempo (rapidez de respuesta) deseada, la cual se asigna mediante
la ubicacion conveniente de los polos de lazo cerrado. Por otro lado, las ca-
ractersticas de respuesta en estado estacionario se consiguen al asegurar que
cuando el tiempo crece el valor de la velocidad alcanza la velocidad deseada
d a pesar de la presencia de una perturbacion externa Tp (s). El controla-
dor es el dispositivo que se encarga de que se satisfagan las caractersticas de
respuesta transitoria y en estado estacionario del sistema en lazo cerrado.
Suponga que la velocidad deseada es una constante o un escalon, es decir
d es una constante. Dado que la planta en (9.24) no tiene polos en s = 0
entonces es de tipo 0. Esto significa que el uso de un controlador proporcional
de velocidad de la forma i = kp (d ), con kp > 0, no puede conseguir
que = d en estado estacionario incluso si no hay perturbaciones externas
de par, es decir, aun cuando Tp = 0. La solucion a este problema es utilizar
un controlador que tenga una accion integral, para que el sistema sea de tipo
1, es decir usar un controlador proporcional-integral (PI). Sin embargo, tal
como se explica en la seccion 5.2.4, un controlador PI no puede conseguir
simultaneamente las caractersticas de respuesta transitoria deseadas y un
rechazo satisfactorio de las perturbaciones externas Tp (s). Por esta razon, a
continuacion se muestra la manera de construir un controlador PI modificado
que puede conseguir simultaneamente estos requerimientos.

9.5.1. Un controlador PI modificado

Aplicando la transformada inversa de Laplace a (9.24) se obtiene la si-


guiente ecuacion diferencial:
1
+ a = ki Tp (9.29)
J
A continuacion se demuestra que el siguiente controlador:
Z t
a
i = kp (d ) + ki (d (r))dr + d + k1 ((0) d ) (9.30)
0 k
donde (0) es la velocidad inicial, consigue que ante una velocidad deseada
constante d la velocidad alcance dicho valor deseado en estado estacionario,
que responda con una constante de tiempo fijada a voluntad y que el efecto
de una perturbacion constante Tp desaparezca tan rapido como se desee.
Sustituyendo (9.30) en (9.29) y acomodando terminos se encuentra:
Z t
1
+ (a + kp k)( d ) + ki k ((r) d )dr = k1 k((0) d ) Tp
0 J
510 9 Control de velocidad de un motor de CD

Definiendo:

kp = kp + k1

se obtiene:
Z t
+ (a + kp k)( d ) + ki k ((r) d )dr
0
1
+k1 k[ d ((0) d )] = Tp
J
Notese que:
Z t
d ((0) d ) = ((r) d )dr
0

y si ademas de define:

ki = ki k1

entonces:
Z t
+ (a + kp k)( d ) + k1 k [ki ((r) d ) + ((r) d )] dr
0
1
= Tp (9.31)
J
Pero como d es una constante, entonces d = 0. As que si se define:

ki = a + kp k
Z t
= [(r) + ki ((r) d )] dr
0

entonces se puede escribir (9.31) como:


1
+ k1 k = Tp
J
Aplicando la transformada de Laplace con condiciones iniciales cero:

J1
(s) = Tp (s)
s + k1 k
o tambien:
J1 s
s(s) = Tp (s) (9.32)
s + k1 k
td
Si Tp = td es una constante, es decir Tp (s) = s entonces:
9.5 Control de velocidad 511

J1 s td
s(s) =
s + k1 k s
Aplicando el teorema del valor final se tiene:
= lm s [s(s)]
lm (t)
t s0

J1 s td
= lm s =0
s0 s + k1 k s
=
As que si k1 k > 0, el filtro en (9.32) es estable y se asegura que lmt (t)

0. Mas aun, la rapidez con que (t) se aproxima a cero es mayor conforme
k1 k > 0 es mayor. Notese que lmt (t) = 0 implica que:
Z
d t
[(r) + ki ((r) d )] dr = + ki ( d ) 0
dt 0
tambien tiende a cero. Esto significa que el efecto de la perturbacion constante
desaparece al crecer el tiempo y solo queda la ecuacion diferencial + ki =
ki d , la cual es estable si ki > 0, tiene constante de tiempo = k1 y tiene
i
ganancia unitaria en estado estacionario. Todo esto significa que:
Si no hay perturbacion (Tp = 0 y (t) = 0 para todo t 0), la respuesta
en velocidad es como la de un sistema de primer orden con constante de
tiempo = k1 . La velocidad alcanza la velocidad deseada d (constante)
i
en estado estacionario.
Si aparece una perturbacion constante (Tp = td 6= 0), la desviacion pro-
ducida por la perturbacion desaparece al crecer el tiempo. Mas aun, si
se escoge un valor de k1 mayor (de manera que el producto k1 k > 0 es
mayor), entonces la desviacion producida por la perturbacion desaparece
mas rapido. Si una vez que la desviacion debida a la perturbacion es lle-
vada a cero (cuando = d ) se ordena un cambio en el valor constante
de d (se ordena un cambio de velocidad deseada d estando presente la
perturbacion Tp ), entonces la velocidad responde como si la mencionada
perturbacion constante Tp no existiera, es decir, como en el punto anterior:
con una constante de tiempo = k1 y la velocidad alcanza la velocidad
i
deseada d en estado estacionario.
Debido a que en control clasico siempre se supone que todas las condiciones
iniciales son cero, entonces se puede suponer que (0) = 0 y el controlador en
(9.30) se escribe como:
Z t a

i = kp (d ) + ki (d (r))dr + k1 d (9.33)
0 k
que constituye un simple controlador PI con un termino constante de prea-
limentacion. Finalmente, la regla de sintona es resumida por la siguientes
expresiones:
512 9 Control de velocidad de un motor de CD

kp = kp + k1 (9.34)
ki = ki k1
ki = a + kp k

donde:
kp > 0 se elige de modo que quede fijada la constante de tiempo deseada
= k1 = a+k 1
k , la cual siempre es menor que la constante de tiempo de
i p

la planta a controlar a1 , lo cual es muy conveniente.


k1 > 0 se elige grande para reducir rapidamente a cero la desviacion de-
bida a la perturbacion. Esto puede hacerse al tanteo o puede calcularse
recordando que k11k es la constante de tiempo del filtro en (9.32), el cual
es el responsable de eliminar la desviacion producida por la perturbacion.
Otra manera (mas conocida) de disenar un controlador PI con las mismas
ventajas que el que se acaba de presentar es usando el concepto de contro-
ladores con dos grados de libertad. Esto es lo que se muestra en la siguiente
seccion.

9.5.2. Un controlador con dos grados de libertad

Un sistema en lazo cerrado que cuenta con un controlador con dos grados
de libertad tiene la estructura mostrada en la figura 9.5. El controlador esta
formado por los dos componentes con funciones de transferencia Gc1 (s) y
Gc2 (s), mientras que Gp (s) es la planta que se desea controlar. Tambien se
toma en cuenta la presencia de una perturbacion a la entrada de la planta
D(s). En el ejemplo 4.5 de la seccion 4.1 se muestra que la salida del sistema
en lazo cerrado se puede calcular como:

(s) = G1 (s)d (s) + G2 (s)D(s)

donde:
Gc1 (s)Gp (s)
G1 (s) =
1 + (Gc1 (s) + Gc2 (s))Gp (s)
Gp (s)
G2 (s) = (9.35)
1 + (Gc1 (s) + Gc2 (s))Gp (s)
son las funciones de transferencia:
(s)
G1 (s) = , cuando D(s) = 0
d (s)
(s)
G2 (s) = , cuando d (s) = 0
D(s)
La razon por la cual este esquema recibe el nombre de controlador de dos
grados de libertad es que las dos funciones de transferencia definidas en (9.35)
9.5 Control de velocidad 513

pueden ser sintonizadas independientemente una de la otra utilizando para


ello, como variables independientes (o grados de libertad), a las dos partes del
controlador Gc1 (s) y Gc2 (s). Dado que la planta que interesa en este captulo

D(s)
+
! d (s) + I (s) !(s)
G c1 (s) G p ( s)
+ +

G c2 (s)

Figura 9.5. Sistema en lazo cerrado usando un controlador con dos grados de
libertad.

es un motor de CD, suponga que:


k
Gp (s) =
s+a
Suponga tambien que Gc1 (s) y Gc2 (s) son controladores PI, es decir:
kp1 s + ki1 kp2 s + ki2
Gc1 (s) = , Gc2 (s) =
s s
kp s + ki
Gc (s) = Gc1 (s) + Gc2 (s) = , kp = kp1 + kp2 , ki = ki1 + ki2
s
Por tanto, la primera funcion de transferencia en (9.35) se puede escribir como:
k
(s) Gc1 (s) s+a
= k s+k k
d (s) 1 + p s i s+a
skGc1 (s)
= (9.36)
s2 + (a + kp k)s + ki k
Suponga que se desea que la respuesta en lazo cerrado, ante una referencia
deseada, sea la de un primer orden con un polo en s = p1 , con p1 > 0.
Entonces el polinomio caracterstico en la expresion anterior debe satisfacer:
s2 + (a + kp k)s + ki k = (s + p1 )(s + f )
= s2 + (p1 + f )s + p1 f
donde la raz en s = f , f > 0, se introduce solo para conseguir un poli-
nomio de segundo orden en el miembro derecho de esta expresion. Igualando
coeficientes en ambos miembros se obtiene:
514 9 Control de velocidad de un motor de CD

a + kp k = p1 + f, ki k = p1 f

de donde se encuentra:
p1 + f a p1 f
kp = , ki =
k k
Por otro lado, con el fin de que la respuesta ante una referencia deseada sea
la de un primer orden con un polo en s = p1 , la funcion de transferencia en
(9.36) debe tener la forma:
(s) p1 (s + f ) p1 (s + f ) p1
= 2 = = (9.37)
d (s) s + (a + kp k)s + ki k (s + p1 )(s + f ) s + p1

Por tanto, igualando (9.36) y (9.37) se encuentra que:

skGc1 (s) = p1 (s + f )

de donde se concluye que Gc1 (s) es un controlador PI:


kp1 s + ki1 p1 p1 f
Gc1 (s) = , kp1 = , ki1 =
s k k
Con este resultado se puede calcular Gc2 (s) como:
kp2 s + ki2 f a
Gc2 (s) = Gc (s) Gc1 (s) = , kp2 = , ki2 = 0
s k
Es decir, Gc2 (s) = kp2 es un controlador proporcional. Por otro lado, la se-
gunda funcion de transferencia en (9.35) toma la forma:
k
(s) s+a
= kp s+ki k
D(s) 1+ s s+a
ks
=
s2
+ (a + kp k)s + ki k
ks
= (9.38)
(s + p1 )(s + f )
Usando esta expresion y el teorema del valor final se puede comprobar que
td
el efecto de una perturbacion externa constante D(s) = Jks desaparece
conforme el tiempo crece. Mas aun, la rapidez con que esto sucede es mayor
conforme f y p1 son mayores. Como p1 esta fijada por la rapidez de respuesta
deseada ante una referencia constante, entonces f es el parametro que que-
da libre. Entonces, f debe escogerse grande. De acuerdo a la figura 9.5, el
controlador esta dado como:

I (s) = Gc1 (s)(d (s) (s)) Gc2 (s)(s)


(d (s) (s))
= kp1 (d (s) (s)) + ki1 kp2 (s)
s
9.6 Prototipo experimental 515

(d (s) (s))
= (kp1 + kp2 )(d (s) (s)) + ki1 kp2 d (s)
s
(d (s) (s))
= kp (d (s) (s)) + ki1 kp2 d (s)
s
(9.39)

Usando la transformada inversa de Laplace se obtiene finalmente:


Z t
i = kp (d ) + ki1 (d (r))dr kp2 d (9.40)
0

Notese que los controladores en (9.40) y (9.33) son identicos si se define:

f
k1 = , p1 = ki
k
Por tanto, se deja al criterio del lector decidir cual de los enfoques presentados
en las secciones 9.5.1 o 9.5.2 para obtener este controlador es el que prefiere.

9.6. Prototipo experimental

A continuacion se listan los componentes principales del sistema de control.


Microcontrolador PIC16F877A [8].
Convertidor digital/analogico de 8 bits DAC0800LCN.
2 motores de CD con escobillas e iman permanente. Voltaje nominal de
24[V], corriente nominal de 2.3[A].
Las flechas de los dos motores se unen de modo que uno de los motores se
utiliza como generador. El voltaje generado es utilizado como la medicion de
la velocidad del otro motor el cual es controlado de acuerdo a la ley de control
en (9.33).
En la figura 9.6 se muestra el diagrama electrico utilizado para construir
el sistema de control de velocidad. El algoritmo de control en (9.33) se calcula
usando el microcontrolador PIC16F877A. Es decir, conocido el valor deseado
de velocidad d y la medicion de la velocidad , el microcontrolador calcula
el valor de la senal de control i en (9.33). En la seccion 9.9 se muestra el
listado del programa utilizado.
A continuacion se describe la manera en que el microcontrolador PIC16F87
7A realiza su funcion de controlador. Antes que nada se debe aclarar que no
es el proposito presentar toda una exposicion de como trabaja este micro-
controlador. Lo que se presenta es una descripcion de los recursos de este
microcontrolador que se utilizan para construir el controlador bajo prueba.
Se usa el canal 0 del convertidor analogico/digital con que cuenta este mi-
crocontrolador. Solo se utilizan los 8 bits mas significativos de este convertidor
el cual tiene un rango analogico de entrada de [0,+5][V]. Por tanto, el dato
516 9 Control de velocidad de un motor de CD

Figura 9.6. Diagrama electrico del sistema de control de velocidad de un motor de


CD.
9.6 Prototipo experimental 517

entregado por el convertidor t 0 es sometido a la operacion: w=0.0196*t 0


(donde 0.0196=5/255) para obtener en la variable w el voltaje a la entrada
del convertidor analogico/digital. Este voltaje es el entregado por el motor que
se utiliza como generador y es proporcional a la velocidad del motor que se
quiere controlar. Por tanto, se asume que este voltaje representa el valor me-
dido de velocidad. Notese que antes de entrar al convertidor analogico/digital
(por el pin 2 del microcontrolador), el voltaje del generador pasa a traves de un
divisor de tension que tiene como funcion adaptar el maximo voltage generado
(12.3[V] a velocidad maxima) a un valor de 5[V], es decir dentro del rango del
voltaje analogico que maneja el convertidor analogico/digital. El amplificador
operacional TL081 es utilizado para proteger al microcontrolador.
Tal como se indica en la figura 9.6 el valor de i debe aparecer a la entra-
da del amplificador operacional TL081 dentro del recuadro titulado control
de corriente. Esto se consigue del siguiente modo. Primero, en el programa
listado en la seccion 9.9 se hace iast=-iast, para cambiar el signo de i a i .
El microcontrolador debe entregar un codigo digital (iastd) de 8 bits al conver-
tidor digital/analogico de 8 bits DAC0800LCN. Para esto, el microcontrolador
realiza la operacion:

iastd = 36.4286 iast + 127

la cual obedece a la relacion mostrada graficamente en al figura 9.7. Una vez

iastd

255

127

3:5 3:5 iast

Figura 9.7. Acondicionamiento de la senal i que debe ser enviada al convertidor


digital-analogico.

calculada iastd se entrega al convertidor digital/analogico a traves del puer-


to D (PORTD=iastd). El convertidor digital/analogico trabaja en conjunto
con un amplificador operacional TL081. Estos dispositivos estan conectados
de acuerdo a las sugerencias del fabricante [9]. Esto asegura que a la salida del
518 9 Control de velocidad de un motor de CD

amplificador operacional se obtiene un voltaje cuyo valor numerico correspon-


de al de i . Este valor es recibido por otro amplificador operacional TL081
que se encarga de evaluar el lazo de corriente:

ui = 100(i i)

La razon de que deba aparecer i en el lugar que se indica en la figura 9.6


tiene que ver con la compatibilidad de signos que deben respetar los amplifi-
cadores operacionales colocados en dicha figura. Por otro lado, el amplificador
de potencia de ganancia unitaria esta constituido por un tercer amplificador
operacional TL081 junto con dos transistores de potencia TIP141 y TIP145,
conectados en simetra complementaria
El Manejador/Receptor MAX232 se encarga de enviar la velocidad medi-
da y la senal de control i hacia una computadora portatil (a traves de un
conector USB a serie) cuyo unico proposito es el graficado de dichas variables.
Esto se hace a traves de las variables cuentaH=0x00 y cuentaL=t 0 (para
enviar la velocidad) o cuentaH=0x00 y cuentaL=(iastd) &(0xFF) (para
enviar la senal de control). Estos datos son enviados a la computadora portatil
mediante las instrucciones: putc(0xAA); putc(cuentaH); putc(cuentaL);. Fi-
nalmente, el timer TMR0 es utilizado para establecer un periodo de muestreo
T = 0.002[seg] (40 cuentas del timer 0).

9.6.1. Control de corriente

El lazo de corriente presentado en (9.14) se construye del siguiente modo.


Se conecta una resistencia de potencia (de ceramica) de 1[Ohm] en serie con
la armadura del motor de CD. Esto permite que en las terminales de dicha
resistencia aparezca un voltaje que numericamente es igual a la corriente i
que circula por el motor. Entonces, el amplificador operacional mostrado en
el bloque control de corriente de la figura 9.6 realiza la operacion indicada
en (9.14) con K = 100.

9.6.2. Amplificador de potencia

De acuerdo a lo expuesto en la seccion 8.1.2 el bloque denominado ampli-


ficador de potencia en la figura 9.6 permite reducir la zona muerta introdu-
cida por los transistores de potencia conectados en simetra complementaria.
Ademas, con los valores ah presentados se consigue Ap = 1 en (9.13) y en
(9.15). Esto permite obtener Ap K = 100. Este valor fue elegido porque con
el se obtuvieron resultados satisfactorios. Es ilustrativo resaltar que en los
manejadores comerciales para uso industrial es comun encontrar valores tan
grandes como Ap K = 700 [7].
9.7 Resultados experimentales 519

9.7. Resultados experimentales


En la figura 9.8 se muestran los resultados experimentales obtenidos con
el controlador en (9.33) (o equivalentemente con el controlador en (9.40)) y
con el prototipo experimental descrito en la seccion previa. Partiendo de una
velocidad inicial igual a cero, se ordena la siguiente velocidad deseada que
tiene la forma de tres escalones sucesivos:

1.5, 0 t < 4
d = 2.5, 4 t < 12 (9.41)

1.5, t 12
Tambien se aplica, via software, una perturbacion constante de valor Tp = 2.5

! 3

[V] 2.5

1.5

1 0:632 1:5
0.5

0
0 2 4 6 8 10 12 14 16 18 20 22
0:623
i 3
[A] 2

-1

-2

-3
0 2 4 6 8 10 12 14 16 18 20 22

tiempo [s]

Figura 9.8. Control de velocidad usando el controlador PI modificado mostrado en


(9.33) (o equivalentemente con el controlador en (9.40).

en t = 8[s], la cual desaparece en t = 17[s]. Las ganancias del controlador en


(9.33) se calculan de acuerdo a (9.34) junto con los valores numericos en (9.28)
y:
kp = 0.5, k1 = 4.0
lo cual fija la constante de tiempo deseada en = 0.6231[s]. En la figura 9.8
se muestra la velocidad medida como resultado del experimento y una linea
520 9 Control de velocidad de un motor de CD

blanca que representa la respuesta, obtenida en simulacion, del sistema sin


perturbaciones:

+ ki = ki d (9.42)
1
con ki = 0.6231 , es decir el valor calculado de acuerdo a (9.34), y con d dada en
(9.41). Notese que la respuesta experimental de velocidad sigue exactamente
la respuesta teorica dictada por (9.42) y que esto sigue siendo cierto durante
la transicion de d = 2.5 a d = 1.5 en t = 12[s] a pesar de que durante dicha
transicion sigue aplicada la perturbacion constante Tp = 2.5. Esto comprueba
las afirmaciones establecidas justo antes de (9.33). Ademas, es importante
subrayar que se han conseguido exactamente las especificaciones de respuesta
transitoria y de estado estacionario y ademas las desviaciones que aparecen
cuando se aplica y desaparece la perturbacion externa son llevadas a cero
rapidamente.
A continuacion se muestran los resultados obtenidos con un controlador
PI clasico con el fin de comparar con los resultados obtenidos en la figura 9.8.
En la figura 9.9 se muestran los resultados obtenidos usando un controlador
PI clasico cuando se seleccionan las ganancias de acuerdo a:
ki 1
= a, = = 0.6231[s] (9.43)
kp kp k

segun se discute en la seccion 5.2.4, con la constante de tiempo deseada en


lazo cerrado. La velocidad deseada d es identica a la mostrada en (9.41) y se
aplica una perturbacion identica a la usada en la figura 9.8, es decir, se aplica
via software una perturbacion constante de valor Tp = 2.5 en t = 8[s], la cual
desaparece en t = 17[s]. Se observa lo siguiente:
La parte transitoria de la respuesta, aunque cercana a la deseada, no es
tan exacta como en la figura 9.8 (la lnea tenue representa la respuesta
transitoria deseada).
La velocidad medida en estado estacionario alcanza la velocidad deseada
cuando no hay perturbacion externa aplicada, es decir, antes de t = 8[s].
La desviacion producida por la aparicion de una perturbacion externa es
mucho mas grande que en la figura 9.8 y tarda mucho mas tiempo en ser
compensada. De hecho esta desviacion no alcanza a ser compensada antes
de que aparezca el nuevo cambio de valor deseado de velocidad en t = 12[s].
Se aprecia lo mismo cuando la perturbacion desaparece en t = 17[s]. De
acuerdo a la seccion 5.2.4, esto se debe a que la dinamica de respuesta
ante la perturbacion tiene una constante de tiempo dominante igual a la
constante de tiempo del motor en lazo abierto a1 , la cual es de 2.7[s] como
se indica en (9.27).
En la figura 9.10 se muestran los resultados obtenidos usando un contro-
lador PI clasico cuando se seleccionan las ganancias de acuerdo a:
9.7 Resultados experimentales 521

! 5

[V] 4

0
0 2 4 6 8 10 12 14 16 18 20 22
0:623
i 3
[A] 2

-1

-2

-3
0 2 4 6 8 10 12 14 16 18 20 22
tiempo [s]

Figura 9.9. Control PI clasico de velocidad usando la regla de sintona en (9.43).

ki l2 l3
= d, d = 1.4 < p1 , kp = (9.44)
kp l1 k
1
l1 = abs(p1 + d), l2 = abs(p1 ), l3 = abs(p1 + a), p1 = = 1.6
0.6231
Este criterio de sintona es presentado en (5.36) en la seccion 5.2.4, con
= 0.6231[s] la constante de tiempo mas lenta con la que el efecto de la
perturbacion es rechazada. Esta constante de tiempo se escoge igual a la cons-
tante de tiempo deseada en la respuesta ante la referencia de velocidad porque,
de acuerdo a (9.38), esta es la constante de tiempo mas lenta presente en el
rechazo a la perturbacion en el controlador cuyos resultados experimentales
se muestran en la figura 9.8 (f > p1 para los valores numericos utilizados). La
velocidad deseada d es identica a la mostrada en (9.41) y se aplica una per-
turbacion identica a la usada en la figura 9.8, es decir, se aplica via software
una perturbacion constante de valor Tp = 2.5 en t = 8[s], la cual desaparece
en t = 17[s]. Se observa lo siguiente:
La desviacion producida por la aparicion de una perturbacion externa es
reducida a cero con una rapidez comparable con la mostrada en la figura
9.8.
Sin embargo, la parte transitoria de la respuesta ante la referencia deseada,
aunque muy rapida, no corresponde a la respuesta transitoria deseada
522 9 Control de velocidad de un motor de CD

representada por la linea tenue mostrada en la figura 9.10. Tal como se


explica en la seccion 5.2.4, esto se debe el sistema en lazo cerrado tiene
dos polos, uno se asigna en s = p1 pero el otro ocupa un lugar muy a la
1
izquierda de este valor. Mas aun, el polo ubicado en s = 0.6231 = 1.6 =
p1 es muy cercano al cero en s = d = 1.4 por lo que sus efectos se
compensan (se cancelan) considerablemente y solo se aprecia la dinamica
del polo rapido colocado muy a la izquierda.

! 3

[V]
2.5

1.5

0.5

0
0 2 4 6 8 10 12 14 16 18 20 22
0:623 tiempo [s]

Figura 9.10. Control PI clasico de velocidad usando la regla de sintona en (9.44).

En conclusion, los resultados experimentales de las figuras 9.9 y 9.10 com-


prueban las afirmaciones presentadas en la seccion 5.2.4 sobre el control PI
clasico de velocidad: no se tiene una regla de sintona que permita calcular de
manera exacta las ganancias proporcional e integral para obtener simultanea-
mente las caractersticas deseadas de respuesta transitoria ante una referencia
de velocidad deseada y un rechazo de perturbaciones satisfactorio. Esto jus-
tifica el interes por el uso del controlador PI modificado presentado en (9.33)
cuyos resultados experimentales se muestran en la figura 9.8.

9.8. Calculo numerico de la integral


Esta operacion esta representada por:
9.9 Programacion del microcontrolador PIC16F877A 523
Z t
y= w(s)ds
0

y se puede aproximar numericamente mediante:

y(k + 1) = y(k) + w(k)t (9.45)

donde y(k) es el valor de la integral calculado en el instante de muestreo


presente con y(0) = 0 y y(k + 1) es el valor de la integral en el instante de
muestreo proximo inmediato en el futuro. Esto significa que y(k) debe usarse
como el valor del termino integral en el instante presente mientras que y(k +1)
debe calcularse en el instante presente pero debe ser utilizado como el valor
del termino integral solo hasta el siguiente instante de muestreo. La expresion
en (9.45) se obtiene a partir de la interpretacion geometrica de la integral de
w, es decir, el area debajo de la curva definida por w. As, el termino w(k)t
representa el area que se incrementa en cada instante de muestreo: w(k) y t
representan, respectivamente, la altura y la base del rectangulo que aproxima
a dicho incremento de area.

9.9. Programacion del microcontrolador PIC16F877A


Se recomienda consultar la referencia [10] para una explicacion precisa de
cada una de las instrucciones que aparecen en el siguiente listado.

// Programa para comunicacion serial entre PC y proyecto Control


// Con el PIC16F877A y el compilador PCWH V3.43
#include<16f877A.h>
#include<stdlib.h>
#include<math.h>

#fuses HS,NOWDT,PUT,NOBROWNOUT,NOLVP,NOWRT,NOPROTECT,NOCPD

#use delay(clock=20000000) //Base de tiempo para


//retardos(frecuencia del Xtal)
//Config.P.Serie
#use rs232(baud=115200,XMIT=PIN_C6,RCV=PIN_C7,BITS=8,PARITY=N)
//direcciones de los puertos y algunos registros
#byte OPTION= 0x81
#byte TMR0 = 0x01
#byte PORTA = 0x05

#byte PORTB = 0x06

#byte PORTC = 0x07


#byte PORTD = 0x08
#byte PORTE = 0x09
524 9 Control de velocidad de un motor de CD

#byte ADCON0= 0x1F


#byte ADCON1= 0x9F
#bit PC0 = 0x07.0

#bit PC1 = 0x07.1


//------------Declaracion de variables------------//
int16 inter,cuenta;

int8 cuentaH,cuentaL,puerto,AB,AB_1,aux;

int8 cont,iastd,cont2,cont3,cont4,t_0;

float w,error,iast,wm1,kp,ki,ie,k,a,wd,tiempo,kpp,k3,kib,cte;
unsigned int u,i;
//------------Rutina de interrupcion------------//
#int_rb void rb_isr() {
puerto=PORTB;
AB=((puerto)&(0x30))>>4;
aux=AB^AB_1;
if(aux!=0)
if(aux!=3)
if(((AB_1<<1)^AB)&(0x02))
cuenta--;
else
cuenta++;
AB_1=AB;
}
//------------Programa principal------------//
void main(void) {
setup_adc(ADC_CLOCK_INTERNAL ); //ADC (reloj interno)
set_tris_a(0b11111111);
set_tris_b(0b11111111);
set_tris_c(0b10000000); //comunicacion serial
set_tris_d(0b00000000);
set_tris_e(0b11111111);
OPTION=0x07; //prescaler timer0, 1:256
PORTC=0;
TMR0=0;
cuenta=0;
AB=0;
AB_1=0;
enable_interrupts(global);
enable_interrupts(int_rb);
cont=4;
cont2=0;
cont3=0;
cont4=0;
PORTD=127;
9.9 Programacion del microcontrolador PIC16F877A 525

k=2.4691;
a=1/2.7;
kpp=0.5;
k3=4.0;
kp=kpp+k3;
kib=a+k*kpp;
ki=kib*k3;
cte=a/k-k3;
tiempo=0.0;
wm1=0.0;
ie=0.0;
ADCON1=0x04;
ADCON0=0x81;
while(cont2<3)
{
while(cont3<255)
{
TMR0=0;
while(TMR0<255)
{
}
cont3++;
}
cont2++;
}
TMR0=0;
while(TRUE)
{
cont++;
ADCON0=0x81; //Cambiando a CH0
for(i=0;i<37;i++); //estabilizar capacitor interno
t_0=read_adc(); //leer ADC
w=0.0196*t_0;
if(tiempo<4.0)
wd=1.5;
else
if(tiempo<12.0)
wd=2.5;
else
wd=1.5;
// wd=2.5;
error=wd-w;
/* Controlador */
iast=kp*error+ki*ie+cte*wd;
ie=ie+0.002*error;
/* ___________________________________________ */
if(iast<-3.3)
iast=-3.3;
if(iast>3.3)
526 9 Control de velocidad de un motor de CD

iast=3.3;
// iast=0.3;
iast=-iast;
if(tiempo>8.0)
{
if(tiempo<17.0)
iast=iast+2.5;
}
iastd=(unsigned int)(36.4286*iast+127);
PORTD=iastd;
wm1=w;
/*
// inter=(cuenta)&(0xFF00);
cuentaH=0x00; //inter>>8;
cuentaL=t_0;//(cuenta)&(0x00FF);
putc(0xAA); //reconocimieno al puerto serial
putc(cuentaH); //mandando cuenta al puerto serial
putc(cuentaL);
if(cont==5)
{
cont=0;
cont4++;
if(cont4==255)
cont4=0;
}
*/
if(tiempo>8.0)
{
if(tiempo<17.0)
iast=iast-2.5;
}
iast=-iast;
iastd=(unsigned int)(36.4286*iast+127);
// inter=(cuenta)&(0xFF00);
cuentaH=0x00; //inter>>8;
cuentaL=(iastd)&(0xFF);
putc(0xAA); // reconocimieno al puerto serial
putc(cuentaH); //mandando cuenta al puerto serial
putc(cuentaL);
if(cont==5)
{
cont=0;
cont4++;
if(cont4==255)
cont4=0;
}
PC1=1; //inicia espera del timer
while(TMR0<40) // 1 cuenta=(4/FXtal)*256 seg, 40=2 ms
{
9.11 Preguntas de repaso 527

}
PC1=0; //termina espera del timer
TMR0=0;
tiempo=tiempo+0.002;
} //cierre del while infinito
} //cierre del main

9.10. Resumen del captulo

Se ha presentado la manera de controlar la velocidad de un motor de


CD. Para esto se ha mostrado la manera de construir de manera practica y
experimental dos controladores de velocidad: uno es un PI clasico y el otro
es un PI modificado. Se ha mencionado cuales son los problemas que tiene el
controlador PI clasico y como resolverlos usando el controlador PI modificado.
Tambien se ha descrito la manera de construir las interfases necesarias para
el correcto funcionamiento del sistema de control y como se puede programar
un microcontrolador para realizar la funcion de un controlador digital.
Es importante resaltar el hecho de que en la literatura sobre control de
motores electricos es comun usar como entrada al par generado por el motor
(o bien, la corriente electrica de armadura). Esto se hace a pesar de que es
el voltaje aplicado al motor la variable que se puede manipular directamente
en el motor mientras que el par es un producto que resulta de la ecuacion
diferencial que describe al circuito electrico de armadura. En este captulo
se ha explicado que si se usa un lazo interno de corriente de alta ganancia
se puede, efectivamente, usar la corriente de armadura (y, por tanto, el par
generado ya que ambas variables son proporcionales) como la variable de
entrada. Tambien se ha explotado este ejemplo para resaltar el papel que
juega un amplificador de potencia en un sistema de control.
Un problema importante que se debe resolver antes de disenar un contro-
lador es el de determinar los valores numericos de los parametros del modelo
de la planta a controlar. En este captulo se ha mostrado una manera ex-
perimental que es efectiva para resolver este problema en un motor de CD.
Basicamente la idea es explotar el hecho de que el modelo de la planta es de
primer orden, modelos cuya respuesta ante una entrada escalon es bien cono-
cida. El metodo que se propone es ampliamente recomendable porque con un
simple experimento se puede resolver el problema completo.

9.11. Preguntas de repaso

1. Que es un lazo de corriente y para que se usa?


2. Por que un controlador PI es suficiente para controlar la velocidad de un
motor de CD? Por que no usar un controlador PID?
528 9 Control de velocidad de un motor de CD

3. Se ha dicho que un controlador PI lleva a cero el error en estado esta-


cionario en un sistema de control de velocidad a pesar de la presencia de
cualquier perturbacion constante Que precaucion debe tomar en cuenta
en la practica para que efectivamente se pueda compensar la presencia de
una perturbacion constante?
4. Un controlador PI es efectivo para llevar a cero el error en estado esta-
cionario cuando el valor deseado de velocidad no es constante? Y si la
perturbacion no es constante? Explique.
5. Como usara las ideas expuestas en el presente captulo para controlar
el voltaje producido por un generador electrico que es impulsado por un
motor de CD?
6. Como usara las ideas expuestas en el presente captulo para controlar
un sistema de control de temperatura y un sistema de control de nivel de
lquido?
7. Que controlador usara para los sistemas de la pregunta anterior? Usara
un controlador PID? Por que?
8. Bajo que condiciones el modelo de velocidad de un motor de CD se con-
vertira en un integrador? Que controlador usara bajo estas condiciones
para compensar el efecto de una perturbacion constante? Justifique su
respuesta.
9. Si un controlador PI clasico compensa muy lentamente el efecto de una
perturacion Que ajustes hara en las ganancias del controlador?
10. Cuales son los efectos de las ganancias proporcional e integral en un
controlador PI clasico?
Referencias

1. R. Ortega, A. Lora, P. J. Nicklasson and H. Sira-Ramrez, Passivity-based con-


trol of Euler-Lagrange Systems, Springer, London, 1998.
2. V.M Hernandez Guzman and R.V. Carrillo Serrano, Global PID position control
of PM stepper motors and PM synchronous motors, International Journal of
Control, vol. 84, no. 11, pp. 1807-1816, 2011.
3. V.M Hernandez Guzman and R. Silva-Ortigoza, PI control plus electric current
loops for PM synchronous motors, IEEE Transactions on Control Systems Te-
chnology, vol. 19, no. 4, pp. 868-873, 2011.
4. G. Espinosa-Perez, P. Maya-Ortiz, M. Velasco-Villa and H. Sira-Ramrez,
Passivity-based control of switched reluctance motors with nonlinear magne-
tic circuits, IEEE Transactions on Control Systems Technology, Vol. 12, pp.
439448, 2004.
5. J. Chiasson, Modeling and High-performance control of electric machines, IEEE
Press-Wiley Interscience, New Jersey, 2005.
6. Parker Automation, Position systems and Controls, Training and Product Ca-
talog DC-ROM, Compumotors Virtual Classroom, 1998.
7. R. Campa, E. Torres, V. Santibanez and R. Vargas, Electromechanical dyna-
mics characterization of a brushless direct-drive servomotor. Proc. VII Mexican
Congress on Robotics, COMRob 2005, Mexico, D.F., October 27-28, 2005.
8. PIC16F877A Enhanced Flash Microcontroller, Data sheet, Microchip Techno-
logy Inc., 2003.
9. DAC0800 8-bit Digital-to-Analog Converter, Data sheet, National Semiconduc-
tor Corporation, 1995.
10. Custom Computer Services Incorporated, CCS C Compiler Reference Manual,
2003.
10
Control de posicion de un motor de CD

El problema de control de posicion tiene muchas e importantes aplicacio-


nes en la industria. Quiza una de las aplicaciones mas claras es la del control
de robots manipuladores. En estas tareas, el robot debe ensamblar las piezas
que conforman a un componente mas complejo. Para ello, el robot debe to-
mar una pieza, llevarla a un lugar especificado y colocarla dentro del espacio
correspondiente. Para conseguir esto, se coloca un motor electrico (frecuen-
temente de CD y con escobillas) en cada una de las partes moviles del robot
(conocidas como uniones). Entonces se debe controlar la posicion de cada
motor de manera individual para alcanzar un valor de posicion deseado. La
posicion deseada de cada motor es seleccionada de manera que si cada motor
la alcanza, entonces el extremo del robot consigue colocar la pieza por ensam-
blar en el lugar correcto. Un problema comun en esta tarea es la presencia
del efecto de la gravedad, la cual aparece como una perturbacion de par que
debe ser compensada. Una vez que el robot se detiene, esta perturbacion de
par es constante.
532 10 Control de posicion de un motor de CD

Objetivos del captulo

Construir controladores tipo proporcional-integral-derivativo usando un


microcontrolador y una computadora personal.
Construir la totalidad de las interfaces electronicas necesarias para el sis-
tema de control completo.
Identificar de manera experimental los parametros del modelo de un motor
de CD.
Identificar las ventajas y las desventajas de los controladores proporcional-
integral-derivativo.
Aplicar a una situacion experimental los conceptos de la teora de control
clasico.
En este captulo se continua con el control de un motor de CD con es-
cobillas e iman permanente, pero ahora se considera el control de posicion.
Con este fn, se recurre al modelo obtenido en (9.23) despues de colocar un
amplificador de potencia y un lazo de corriente (veanse las secciones 9.2 y
9.3). Este modelo se reescribe a continuacion para facilitar su referencia:
1 1
(s) = [kI (s) Tp (s)] (10.1)
s(s + a) J
b nkm
a= , k=
J J
donde (s) es la posicion a controlar, I (s) es la variable de entrada o de
control y Tp (s) es una perturbacion de par externa.

10.1. Identificacion
En esta seccion es de interes realizar un experimento que permita conocer
los valores de las constantes k y a del modelo en (10.1). A continuacion se
explica la manera de disenar dicho experimento. Suponga que no hay ninguna
perturbacion externa aplicada, es decir Tp (s) = 0, por lo que el modelo (10.1)
se reduce a:
k
(s) = I (s) (10.2)
s(s + a)
Suponga que i se disena como un controlador proporcional de posicion, es
decir, de manera que:

i = kp (d ) (10.3)

o, mediante el uso de la transformada de Laplace:

I (s) = kp (d (s) (s)) (10.4)


10.1 Identificacion 533

donde kp es una constante positiva. El diagrama a bloques que combina las


expresiones (10.2) y (10.4) se muestra en la figura 10.1. La funcion de trans-
ferencia de lazo cerrado para este caso es:

(s) kp k n2
= 2 = 2 (10.5)
d (s) s + as + kp k s + 2n s + n2
p a
n = kp k, = p (10.6)
2 kp k

d ( s) + I (s) k
(s)
kp s ( s+a)

Figura 10.1. Control proporcional de posicion.

De acuerdo a (10.5) y lo visto en la seccion 3.3, si la posicion deseada d


es un escalon la respuesta obtenida en el tiempo (t) presenta un sobre paso
y un tiempo de subida dados como:


Mp ( %) = 100 e 12 (10.7)
" p !#
1 1 2
tr = arctan (10.8)
d

si 0 < 1, lo cual siempre se puede conseguir usando un valor de kp


suficientemente grande. A partir de (10.7) y (10.8) se obtiene:
v
u
u ln2 M p( %)
u 100
=t (10.9)
ln2 M100p( %)
+ 2
" p !#
1 1 2
d = arctan (10.10)
tr
d
n = p (10.11)
1 2
Esto permite calcular los valores de k y a utilizando el siguiente procedimiento:
Construya el controlador proporcional mostrado en (10.4) o en (10.3).
Asegurese de que no apareceran perturbaciones externas de par sobre el
motor. Seleccione un valor conocido y positivo de la ganancia kp . Este
534 10 Control de posicion de un motor de CD

valor debe ser suficientemente grande de modo que al aplicar un cambio


tipo escalon en la posicion deseada d se obtenga una posicion del motor
que presenta un sobre paso claramente apreciable. Grafique respecto al
tiempo la posicion que se obtiene como respuesta ante un d tipo escalon.
Mida los valores obtenidos de Mp ( %) y tr .
Utilice las expresiones (10.9)-(10.11) para calcular y n .
Utilice las expresiones en (10.6) y el valor de kp usado en el experimento
para calcular k y a.
En la figura 10.2 se presentan los resultados obtenidos al realizar el expe-
rimento descrito en el procedimiento anterior. Se utiliza un valor kp = 0.5 y
midiendo directamente en la figura 10.2 se encuentran los valores:

Mp ( %) = 78.2 %, tr = 0.09[s]

Estas mediciones se simplifican y al mismo tiempo se hacen mas exactas si


se utiliza un programa de computadora para realizarlas. Con estos valores se
sigue el procedimiento indicado previamente para encontrar que:

k = 675.4471, a = 2.8681 (10.12)

Finalmente, es importante aclarar que, al igual que en el modelo de velocidad,


no es de interes calcular el valor del factor 1/J que aparece como coeficiente de
la perturbacion Tp (s) en (10.1). La razon de esto es que normalmente incluso
el valor de Tp no es conocido y a pesar de ello su efecto puede ser compensado.


[rad]
M p (%) = 78:2

tr = 0:09

i
[A]

tiempo [s]

Figura 10.2. Identificacion experimental.


10.2 Control sin perturbaciones externas (Tp = 0) 535

10.2. Control sin perturbaciones externas (Tp = 0)


El diseno de un controlador tiene como objetivo asegurar que en lazo
cerrado se consigan las caractersticas deseadas de respuesta transitoria y en
estado estacionario. Las caractersticas de respuesta transitoria se refieren al
tiempo de subida (rapidez de respuesta) y al sobre paso (amortiguamiento)
deseados. Estas caractersticas se satisfacen mediante la ubicacion conveniente
de los polos de lazo cerrado. Por otro lado, las caractersticas de respuesta en
estado estacionario se consiguen al asegurar que cuando el tiempo crece el
valor de la posicion alcanza la posicion deseada d . El controlador es el
dispositivo que se encarga de que se satisfagan las caractersticas de respuesta
transitoria y en estado estacionario del sistema en lazo cerrado.
Suponga que la posicion deseada es una constante o un escalon, es de-
cir d = A es una constante. Dado que la planta en (10.1) contiene un polo
en s = 0 entonces es de tipo 1 lo que asegura que = d = A en estado
estacionario, si se usa un controlador proporcional de posicion y si no hay
perturbaciones externas de par, es decir, si Tp = 0. Esto significa que el re-
quisito de alcanzar la posicion deseada es satisfecho de manera natural por
la planta (el motor de CD). Por tanto, el diseno del controlador debe reali-
zarse simplemente buscando que se satisfagan las caractersticas de respuesta
transitoria, es decir, colocando adecuadamente los polos de lazo cerrado. As,
en el caso de un motor de CD hay dos controladores sencillos que permiten
ubicar adecuadamente los polos de lazo cerrado: i) control proporcional con
realimentacion de velocidad e ii) control con una red de adelanto.

10.2.1. Control proporcional con realimentacion de velocidad

En este caso, el controlador esta dado como:

i (t) = kp (d ) kv (10.13)

donde kp y kv son constantes positivas. Usando la transformada de Laplace


se obtiene:

I (s) = kp (d (s) (s)) kv s(s) (10.14)

El diagrama de bloques que resulta de combinar (10.14) y (10.2) es mostrado


en la figura 10.3. La funcion de transferencia de lazo cerrado esta dada como:
(s) kp k n2
= 2 = 2
d (s) s + (a + kv k)s + kp k s + 2n s + n2
p a + kv k
n = kp k, = p (10.15)
2 kp k

Por tanto, siempre se pueden hallar valores positivos de kv y kp que consi-


gan los valores deseados de y n . Esto significa que siempre se pueden ubicar
536 10 Control de posicion de un motor de CD

d ( s) + I (s) (s)
+ k
kp s ( s+a)

kv s

Figura 10.3. Control proporcional de posicion con realimentacion de velocidad.

los polos de lazo cerrado (s + n + jd )(s + n jd ) = s2 + 2n s + n2 , en


cualquier punto sobre el semiplano complejo izquierdo, mediante una seleccion
adecuada de kp y kv . Por ejemplo, considere los valores en (10.12). Suponga
que se desea que la respuesta ante un escalon tenga el sobre paso y el tiempo
de subida que se indican a continuacion:

Mp ( %) = 20 %, tr = 0.068[s] (10.16)

Con estos datos y usando (10.9)-(10.11) se encuentra que los polos de lazo
cerrado deseados estan ubicados en:

s = n jd = 15.4009 j30.0623

con = 0.4559 y n = 33.7776. Finalmente, usando estos valores, (10.12),


(10.15) y (10.16) se encuentra que las siguientes ganancias consiguen el tiempo
de subida y el sobre paso deseados:

kp = 1.6891, kv = 0.0414 (10.17)

En la figura 10.4 se muestran los resultados experimentales obtenidos con el


controlador (10.13) y las ganancias en (10.17) cuando d es un escalon unitario.
El sobre paso y el tiempo de subida medidos en dicho experimento son:

Mp ( %) = 16 %, tr = 0.068[s]

los cuales, puede observarse, son cercanos a los valores de diseno especificados
en (10.16).
Es conveniente decir que el utilizar un sensor especializado para medir
velocidad implica una serie de adaptaciones mecanicas que complican mucho
y elevan el costo de la construccion del sistema de control. Por esta razon,
en la practica es comun estimar la velocidad a partir de la posicion medida.
En los experimentos de la figura 10.4, la velocidad se ha estimado mediante
la diferenciacion numerica de la posicion medida (vease la seccion 10.5). Sin
embargo, este proceso tiene el efecto de un filtro pasa altas: las senales de alta
frecuencia (ruido) son amplificadas de manera importante por el controlador
10.2 Control sin perturbaciones externas (Tp = 0) 537

(realimentacion de velocidad). La presencia de ruido puede resultar en el de-


terioro del desempeno del sistema de control pues puede producir vibraciones
en el motor aun cuando ya se encuentre en reposo. Por tanto, siempre se debe
procurar que la ganancia kv utilizada sea pequena. En la siguiente seccion
se utiliza un controlador que no necesita ni la medicion de la velocidad ni la
diferenciacion de la salida para conseguir los polos deseados de lazo cerrado.


[rad] Mp (%) = 16


tr = 0:068

i
[A]

tiempo [s]

Figura 10.4. Control proporcional de posicion con realimentacion de velocidad.


Resultados experimentales (d = 1.5[rad]).

10.2.2. Control con un compensador de adelanto

En este caso el controlador se especifica mediante su funcion de transfe-


rencia:
I (s) s+d
= (10.18)
E(s) s+c

donde E(s) es la transformada de Laplace de la diferencia e = d , mientras


que , d y c son constantes positivas por calcular que deben satisfacer d < c.
A continuacion se muestra la manera de obtener una expresion que indi-
ca como construir el controlador en (10.18). Mediante division directa de la
fraccion en (10.18) se obtiene:
538 10 Control de posicion de un motor de CD

I (s) = [E(s) + V (s)] (10.19)


dc
V (s) = E(s)
s+c
Suponiendo condiciones iniciales cero, se utiliza la transformada inversa de
Laplace en las dos expresiones dadas en (10.19) para obtener:

i = [e + v] (10.20)
v = cv + (d c)e (10.21)

donde v es la transformada inversa de Laplace de V (s). Entonces, conocien-


do la posicion deseada d y mediante la medicion de se puede calcular la
senal e; utilizando esta senal como variable conocida se resuelve numerica-
mente la ecuacion diferencial en (10.21), con v(0) = 0, para calcular v y luego
usar (10.20) para calcular i . En la seccion 10.5 se explica como realizar este
procedimiento de manera numerica.
Ahora se considerara que el controlador esta dado como en (10.18). En la
figura 10.5 se muestra el diagrama de bloques que resulta de conectar (10.18)
y (10.2). Notese que la funcion de transferencia de lazo abierto:
k(s + d)
G(s)H(s) = (10.22)
s(s + c)(s + a)
tiene tres polos, por lo que la funcion de transferencia de lazo cerrado tambien
tendra tres polos ademas de un cero en s = d. Se deja como ejercicio que
el lector encuentre la funcion de transferencia de lazo cerrado y que verifique
que tiene la siguiente forma:
(s) k(s + d)
= (10.23)
d (s) (s p1 )(s p2 )(s p3 )

d ( s) + I (s) k
(s)
s+d
s+c s ( s+a)

Figura 10.5. Control de posicion con un compensador de adelanto.

Por tanto, en este caso, ademas de ubicar los polos complejos conjugados,
p1 y p2 , en los lugares especificados tambien se debera asegurar que el tercer
polo, en p3 , y el cero en s = d no afectaran de manera importante la res-
puesta transitoria. Tal como se muestra en la seccion 5.2.3, esto se consigue
seleccionando:
10.2 Control sin perturbaciones externas (Tp = 0) 539

n2
d = a, c = 2n , =
k
Usando esta regla de sintona y los parametros en (10.12) se encuentra que el
uso de las ganancias:

c = 30.8018, = 1.6891, d = 2.8681

en el controlador dado en (10.18), o equivalentemente en (10.20), (10.21),


ubica dos polos de lazo cerrado en:

s = n jd = 15.4009 j30.0623

As, se consigue especificar por diseno un tiempo de subida de 0.068[s] y un


sobre paso del 20 %.
En la figura 10.6 se muestran los resultados experimentales obtenidos cuan-
do d es un escalon de 1.5[rad]. Las caractersticas de respuesta transitoria
medidas en esta figura son Mp ( %) = 9.6 %, tr = 0.068[s]. Notese el parecido
de estos valores con los valores de diseno: tr = 0.068[s] y Mp ( %) = 20 %.
Finalmente, es importante subrayar que el uso de la red de adelanto (figura
10.6) tambien resulta en un pequeno error de estado estacionario.
El lector puede preguntarse Que se debe usar como valor final para calcu-
lar el sobre paso? El valor deseado de 1.5[rad] o el valor final de 1.4[rad]? El
valor de Mp ( %) = 9.6 % se obtuvo usando 1.5[rad] como valor final. Notese
que el sobre paso puede ser un poco mas cercano al valor deseado del 20 %
si se mide usando como valor final 1.4[rad]. Esta decision se deja a criterio
del lector. Por otro lado, el tiempo de subida es exactamente el valor deseado
si se usa como valor final el valor deseado de 1.5[rad]. Estos problemas son
debidos a la existencia de un error en estado estacionario que es mucho mas
apreciable que con el controlador proporcional con realimentacion de veloci-
dad. Este error en estado estacionario es debido a la presencia de friccion no
lineal: estatica y de Coulomb (vease (2.21)).
540 10 Control de posicion de un motor de CD


M p (%) = 9:6
[rad]


tr = 0:068

i
[A]

tiempo [s]

Figura 10.6. Control de posicion con un compensador de adelanto. Resultados


experimentales (d = 1.5[rad]).

10.3. Control bajo el efecto de perturbaciones externas


En esta seccion se considera la presencia de una perturbacion externa
constante, es decir:
td
Tp = td , Tp (s) = (10.24)
s
donde td es una constante diferente de cero. Esto significa que se considera
la posibilidad de que algun agente externo al motor aplique un par sobre
su flecha. Si se piensa que el motor podra estar actuando sobre una antena
parabolica, entonces el agente externo que produce la perturbacion de par bien
podra ser el viento que golpea a la antena. Por otro lado, se considera que
la perturbacion es constante porque esto representa el caso extremo en que
el viento golpea a la antena de manera agresiva, con su maxima capacidad
de desviacion. Ademas, la presencia de una perturbacion aproximadamente
constante durante intervalos de tiempo que pueden ser cortos o largos es una
situacion muy comun en mecanismos. Es importante mencionar que es lo que
se espera de un buen diseno cuando aparece una perturbacion externa: el
efecto de la perturbacion sobre la salida debe ser llevado a cero tan rapido
como sea posible.
En este tipo de aplicaciones es comun utilizar un controlador PID debi-
do a que su parte integral puede llevar a cero las desviaciones debidas a las
10.3 Control bajo el efecto de perturbaciones externas 541

perturbaciones constantes. Sin embargo, tal como se menciona en la seccion


5.2.5, no se cuenta con una regla de sintona que permita calcular de manea
exacta las ganancias de un controlador PID que consigan simultaneamente
las caractersticas deseadas de respuesta transitoria (tiempo de subida y so-
bre paso) y un rechazo satisfactorio de los efectos de la perturbacion externa.
Por esta razon, en las siguientes dos secciones se presentan dos controlado-
res que son disenados especficamente para satisfacer simultaneamente estas
especificaciones.

10.3.1. Un controlador PID modificado

Primero se usa la transformada inversa de Laplace para obtener, a partir


de (10.1), la siguiente ecuacion diferencial:
1
+ a = ki Tp (10.25)
J
A continuacion se muestra que el siguiente controlador permite obtener una
regla de sintona para calcular de manera exacta sus ganancias de modo que
se consiguen simultaneamente las caractersticas deseadas de respuesta transi-
toria (tiempo de subida y sobre paso) y un rechazo satisfactorio de los efectos
de la perturbacion externa:
Z t
i = p (d ) d + k1 p k (d (r))dr k1 ( (0))
0
k1 (a + d k)( (0)) (10.26)

donde d es una constante que representa el valor deseado de posicion mien-


tras que (0) y (0) representan los valores iniciales de posicion y velocidad,
respectivamente. Utilizando el hecho de que:
Z t
(0) = (r)dr
0
Z t
(0) = (r)dr
0

el controlador anterior se puede escribir como:


Z t Z t
i = p (d ) d + k1 p k (d (r))dr k1 (r)dr
0 0
Z t
k1 (a + d k) (r)dr
0
Z th i
= p (d ) d k1 (r) + (a + d k)(r) + p k((r) d ) dr
0

Sustituyendo esto en (10.25) se obtiene:


542 10 Control de posicion de un motor de CD

+ (a + d k) + p k( d )
Z th i 1
+k1 k (r) + (a + d k)(r) + p k((r) d ) dr = Tp
0 J
Esto se puede escribir como:
1
+ k1 k = Tp (10.27)
J
si se define:
Z th i
= (r) + (a + d k)(r) + p k((r) d ) dr
0

Aplicando la transformada de Laplace a (10.27), considerando las condiciones


iniciales iguales a cero, se obtiene:
J1
(s) = Tp (s)
s + k1 k
o tambien:
J1 s
s(s) = Tp (s) (10.28)
s + k1 k
td
Si la perturbacion es una constante, es decir Tp (s) = s , entonces se puede
usar el teorema del valor final para encontrar:
= lm s[s(s)]
lm (t)
t s0
J1 s td
= lm s =0
s0 s + k1 k s
=
As que si k1 k > 0, el filtro en (10.28) es estable y se asegura que lmt (t)
0. Mas aun, la rapidez con que (t) se aproxima a cero es mayor conforme
k1 k > 0 es mayor. Notese que lmt (t) = 0 implica que:
Z th i
d
(r) + (a + d k)(r) + p k((r) d ) dr
dt 0
= + (a + d k) + p k( d ) 0
tambien tiende a cero. Esto significa que el efecto de la perturbacion constante
desaparece al crecer el tiempo y solo queda la ecuacion diferencial + (a +
d k) + p k = p kd , la cual es estable si p > 0 y d > 0, tiene ganancia
unitaria en estado estacionario y las ganancias p y d pueden ser usadas para
asignar arbitrariamente los dos polos de dicho sistema. Todo esto significa que:
Si no hay perturbacion (Tp = 0 y (t) = 0 para todo t 0), la respuesta
en posicion es como la de un sistema de segundo orden con un tiempo de
subida y un sobre paso que pueden ser seleccionados a voluntad escogiendo
convenientemente los valores de p y d . La posicion alcanza la posicion
deseada d (constante) en estado estacionario.
10.3 Control bajo el efecto de perturbaciones externas 543

Si aparece una perturbacion constante (Tp = td 6= 0), la desviacion pro-


ducida por la perturbacion desaparece al crecer el tiempo. Mas aun, si se
escoge un valor de k1 mayor (de manera que el producto k1 k > 0 es ma-
yor), entonces la desviacion producida por la perturbacion desaparece mas
rapido. Si una vez que la desviacion debida a la perturbacion es llevada a
cero (cuando = d ) se ordena un cambio en el valor constante de d (se
ordena un cambio de posicion deseada d estando presente la perturbacion
Tp ), entonces la posicion responde como si la mencionada perturbacion
constante Tp no existiera, es decir, como en el punto anterior: con el tiem-
po de subida y el sobre paso deseados y la posicion alcanza la velocidad
deseada d en estado estacionario.
Debido a que en control clasico siempre se supone que todas las condiciones
iniciales son cero, entonces se puede suponer que (0) = 0, (0) = 0 y el
controlador en (10.26) se escribe como:
Z t

i = p (d ) d + k1 p k (d (r))dr k1 k1 (a + d k)
0
Z t
= [p + k1 (a + d k)](d ) (d + k1 ) + k1 p k (d (r))dr
0
k1 (a + d k)d
Z t
= KP (d ) KD + KI (d (r))dr k1 (a + kd k)d (10.29)
0
KP = p + k1 (a + d k), KD = d + k1 , KI = k1 p k

que constituye un simple controlador PID con un termino constante de prea-


limentacion. Notese que el termino derivativo no contiene la derivada de la
posicion deseada. Finalmente, la regla de sintona del controlador en (10.29)
puede resumirse del siguiente modo:
p > 0 y d > 0 se eligen de modo que queden fijados el tiempo de subida
y el sobre paso deseados mediante la adecuada ubicacion de las races del
polinomio caracterstico s2 + (a + d k)s + p k, es decir:

a + d k = 2n , p k = n2 (10.30)

k1 > 0 se elige grande para reducir rapidamente a cero la desviacion de-


bida a la perturbacion. Esto puede hacerse al tanteo o puede calcularse
recordando que k11k es la constante de tiempo del filtro en (10.28), el cual
es el responsable de eliminar la desviacion producida por la perturbacion.
Otra manera (mas conocida) de disenar un controlador PID con las mismas
ventajas que el que se acaba de presentar es usando el concepto de contro-
ladores con dos grados de libertad. Esto es lo que se muestra en la siguiente
seccion.
544 10 Control de posicion de un motor de CD

10.3.2. Un controlador con dos grados de libertad

A continuacion se explica la manera de disenar un controlador de dos


grados de libertad para el motor de CD que nos ocupa en este captulo. En
la figura 10.7 se muestra el diagrama de bloques de un controlador de dos
grados de libertad. Gp (s) representa la planta mientras que el controlador
esta compuesto por dos partes: Gc1 (s) y Gc2 (s). En el ejemplo 4.5 de la seccion
4.1 se muestra que la salida del sistema en lazo cerrado se puede calcular como:

(s) = G1 (s)d (s) + G2 (s)D(s)

donde:
Gc1 (s)Gp (s)
G1 (s) =
1 + (Gc1 (s) + Gc2 (s))Gp (s)
Gp (s)
G2 (s) = (10.31)
1 + (Gc1 (s) + Gc2 (s))Gp (s)

son las funciones de transferencia:


(s)
G1 (s) = , cuando D(s) = 0
d (s)
(s)
G2 (s) = , cuando d (s) = 0
D(s)

La razon por la cual este esquema recibe el nombre de controlador de dos


grados de libertad es que las dos funciones de transferencia definidas en (10.31)
pueden ser sintonizadas independientemente una de la otra utilizando para

D(s)
+
d ( s) + I (s) (s)
G c1 (s) G p ( s)
+ +

G c2 (s)

Figura 10.7. Sistema en lazo cerrado usando un controlador con dos grados de
libertad.

ello, como variables independientes (o grados de libertad), a las dos partes


del controlador Gc1 (s) y Gc2 (s). Se desea entonces disenar Gc1 (s) y Gc2 (s) de
manera que: i) se puedan especificar a voluntad las caractersticas de respuesta
10.3 Control bajo el efecto de perturbaciones externas 545

transitoria y en estado estacionario ante una referencia deseada, d (s), e ii)


el efecto de una perturbacion externa, D(s), sea reducido a cero tan rapido
como se desee.
Dado que la planta que interesa en este captulo es un motor de CD su-
ponga que:
k
Gp (s) = (10.32)
s(s + a)
El diseno del controlador con dos grados de libertad que se presenta aqu se
fundamenta en considerar que Gc1 (s) y Gc2 (s) son controladores PID [5], cap.
10, y por tanto que se puede escribir:
kd1 s2 + kp1 s + ki1
Gc1 (s) =
s
kd2 s2 + kp2 s + ki2
Gc2 (s) =
s
kd s2 + kp s + ki
Gc (s) = Gc1 (s) + Gc2 (s) =
s
kd (s + )(s + ) kd (s2 + ( + )s + )
= = (10.33)
s s
kd = kd1 + kd2 , kp = kp1 + kp2 , ki = ki1 + ki2

para algunas constantes y . Entonces:


(s) Gc1 (s)Gp (s)
=
d (s) 1 + Gc (s)Gp (s)

Sustituyendo (10.32) y (10.33) en la expresion anterior se tiene:


k
(s) Gc1 (s) s(s+a)
= kd (s2 +(+)s+)
d (s) 1+ k
s s(s+a)
skGc1 (s)
=
s2 (s
+ a) + kd k(s2 + ( + )s + )
skGc1 (s)
= 3 (10.34)
s + (a + kd k)s2 + kd k( + )s + kd k
Suponga que se desea que la respuesta transitoria sea la de dos polos complejos
conjugados dominantes dados como s = + jd y s = jd , > 0,
d > 0. Entonces el polinomio caracterstico debe satisfacer:

s3 + (a + kd k)s2 + kd k( + )s + kd k
= (s + + jd )(s + jd )(s + f )
= s3 + (2 + f )s2 + ( 2 + d2 + 2f )s + ( 2 + d2 )f

de donde se obtienen las siguientes relaciones:


546 10 Control de posicion de un motor de CD

a + kd k = 2 + f (10.35)
kd k( + ) = 2 + d2 + 2f (10.36)
kd k = ( 2 + d2 )f (10.37)
Con el fin de que el polo en s = f , f > 0, no tenga efecto en la respues-
ta transitoria de (10.34) se propone una funcion de transferencia como la
siguiente:
(s) (s + f )
= 3 (10.38)
d (s) s + (2 + f )s2 + ( 2 + d2 + 2f )s + ( 2 + d2 )f
donde, con el fin de conseguir una funcion de transferencia de ganancia uni-
taria en estado estacionario, se debe cumplir
f = ( 2 + d2 )f
es decir:
= 2 + d2 (10.39)
Por otro lado, con el fin de conseguir que las funciones de transferencia en
(10.34) y (10.38) sean iguales se debe imponer la siguiente condicion:
skGc1 (s) = (s + f )
de donde se obtiene:
s + f 1
Gc1 (s) = = kp1 + ki1 (10.40)
sk s
( 2 + d2 ) ( 2 + d2 )f
kp1 = , ki1 =
k k
Esto significa que Gc1 (s) debe ser un controlador PI. El controlador Gc2 (s)
se obtiene despejando de (10.33):
Gc2 (s) = Gc (s) Gc1 (s)
1 ( 2 + d2 ) ( 2 + d2 )f 1
= kd s + kd ( + ) + kd
s k k s
2f 2 + f a
= kd2 s + kp2 , kp2 = , kd2 = kd = (10.41)
k k
donde se han usado (10.35), (10.36) y (10.37). Esto significa que Gc2 (s) es
un controlador PD. Por tanto, de acuerdo a la figura 10.7, el controlador
esta dado como:
I (s) = Gc1 (s)(d (s) (s)) Gc2 (s)(s)
1
= (kp1 + ki1 )(d (s) (s)) (kd2 s + kp2 )(s)
s
1
= (kp1 + kp2 )(d (s) (s)) kd2 s(s) + ki1 (d (s) (s)) kp2 d (s)
s
10.3 Control bajo el efecto de perturbaciones externas 547

Aplicando la transformada inversa de Laplace se obtiene:


Z t

i = (kp1 + kp2 )(d ) kd2 + ki1 (d (r))dr kp2 d (10.42)
0

Tal como se ha hecho hasta ahora, se desea que ante una referencia escalon
haya una respuesta transitoria con 0.068[s] como tiempo de subida y 20 % de
sobre paso. En las secciones anteriores se ha visto que los polos de lazo cerrado
correspondientes estan dados como s = jd donde:

= 15.4009, d = 30.0623 (10.43)

Por otro lado, el valor dado a f no afecta a la parte de la respuesta transito-


ria ante una referencia deseada porque su efecto es cancelado (vease (10.38)).
Cual es el efecto de f entonces y como seleccionarla? La clave de esta res-
puesta esta centrada en dos partes:
Primero se tiene el hecho de que, de acuerdo a (10.35), una vez que se fijan
(polos deseados) y a, k (modelo de la planta) la ganancia derivativa kd
es mayor si f es mayor. De acuerdo a lo mencionado en las secciones
precedentes, ganancias derivativas grandes no son deseables por el ruido
que eso introduce. As que un criterio es seleccionar f tan pequena como
se pueda.
Segundo, la funcion de transferencia ante una perturbacion dada en (10.31)
se calcula como:
(s) ks
=
D(s) (s + + jd )(s + jd )(s + f )
Notese que en esta funcion de transferencia el polo en s = f no puede ser
cancelado de ninguna manera por lo que su efecto sera muy importante en
la parte transitoria de la respuesta ante una perturbacion externa. As que
mientras menor sea el valor de f mas lenta sera la rapidez con la que
el efecto de la perturbacion sera eliminado, lo cual puede ser una gran
desventaja. En este sentido, notese que puede usarse el teorema del valor
final para comprobar que el cero que esta funcion de transferencia tiene
en s = 0 asegura que el efecto en estado estacionario de una perturbacion
constante sera reducido a cero.
As que la seleccion de f debe cumplir un compromiso entre la rapidez con
la que las perturbaciones son rechazadas y el ruido que pueda introducirse.
Propongase:
f = 40 (10.44)
Finalmente, usando los parametros de la planta:

k = 675.4471, a = 2.8681

as como (10.40), (10.41), (10.43), (10.44) se encuentra:


548 10 Control de posicion de un motor de CD

1
Gc1 (s) = 1.6891 + 67.5659 (10.45)
s
Gc2 (s) = 0.1006s + 1.8241 (10.46)
De acuerdo a (10.40), (10.41) y (10.42), el controlador esta dado como:
Z t

i = 3.5132(d ) 0.1006 + 67.5659 (d (r))dr 1.8241d
0
(10.47)
Finalmente, una ultima observacion. El lector puede comprobar que el con-
trolador en (10.42) es identico al controlador en (10.29) si se respeta (10.30)
y se establece que:
f
k1 = , = n , 2 + d2 = n2
k
Por tanto, se deja al criterio del lector decidir cual de los enfoques presentados
en las secciones 10.3.1 o 10.3.2 para obtener este controlador es el que prefiere.
En la figura 10.8 se presentan resultados experimentales obtenidos cuando
se usa el controlador (10.47). Las caractersticas de respuesta transitoria medi-
das ante la referencia constante son tr = 0.068[s] y Mp ( %) = 19.3 %, los cuales
son casi identicos a los deseados (tr = 0.068[s] y Mp ( %) = 20 %). Tambien se
considera la presencia de una perturbacion constante D(s) = Tp (s)/(Jk) =
0.5/s. Esta perturbacion ha sido introducida por software como una senal
que se suma a i , dada en (10.47), a partir de t = 0.7[s]. Notese que el error
en estado estacionario ante una referencia constante es cero, a pesar de la
presencia de friccion no lineal (estatica y de Coulomb) que se describio en las
secciones anteriores. Por otro lado, se puede observar la excelente respuesta
del sistema de control ante la perturbacion. Tambien es interesante observar
que esto se consigue gracias a que se usa un valor muy grande de f = 40, lo
cual, a su vez, es posible gracias al bajo contenido de ruido en la medicion de
la posicion (se usa un encoder para medir la posicion).
En la figura 10.9 se muestran otros resultados experimentales obtenidos
con el controlador (10.47). En este caso se usa la siguiente posicion deseada
que tiene la forma de tres escalones sucesivos:

1.5, 0 t < 1.5
d = 3, 1.5 t < 4 (10.48)

1.5, t4
Se considera la presencia de la siguiente perturbacion externa:


0, 0 t < 0.7



0.5, 0.7 t < 2.55

0, 2.55 t < 3.25
Tp = (10.49)

0.5, 3.25 t < 5.1



0, 5.1 t < 5.8

0.5, t 5.8
10.3 Control bajo el efecto de perturbaciones externas 549

Aparte de la posicion medida experimentalmente (lnea continua) en la figura


10.9 tambien se muestra (linea interrumpida) la respuesta obtenida en simu-
lacion con el sistema sin perturbaciones + 30.8018 + 1140.9 = 1140.9d
el cual responde de acuerdo a las especificaciones de diseno: tr = 0.068[s] y
Mp ( %) = 20 %, pues sus polos estan ubicados en s = 15.4009 j30.0623.
Se puede apreciar que ambas respuestas son casi identicas porque casi no se
pueden distinguir en la figura 10.9. Esto es una muestra clara de que se han
conseguido las caractersticas deseadas de respuesta transitoria y en estado
estacionario ante una referencia deseada. Mas aun, notese que los cambios
de referencia en t = 1.5[s] y t = 4[s] ocurren cuando la perturbacion Tp
esta presente y a pesar de ello aun se satisfacen las caractersticas de respues-
ta transitoria deseadas. Ademas, las desviaciones debidas a la perturbacion
son llevadas a cero rapidamente. Todo esto es evidencia experimental de que
las observaciones hechas justo antes de (10.29) son correctas.


M p (%) = 19:3
[rad]


tr = 0:068

i
[A]

tiempo [s]

Figura 10.8. Control de posicion usando un controlador con dos grados de libertad.
Resultados experimentales (d = 1.5[rad]).

10.3.3. Un controlador PID clasico

Con el fin de apreciar mejor las ventajas del controlador disenado en las
secciones 10.3.1 y 10.3.2 a continuacion se presentan, en las figuras 10.10 y
10.11, algunos resultados experimentales obtenidos al usar el controlador PID
550 10 Control de posicion de un motor de CD


[rad]

i
[A]

tiempo [s]

Figura 10.9. Control de posicion con un controlador con dos grados de libertad.
Resultados experimentales.

clasico:
Z t
d
i = kp (d ) + kd (d ) + ki (d (r))dr
dt 0

Se usa la misma referencia deseada de posicion y la misma perturbacion usa-


das en la figura 10.9, es decir, las definidas en (10.48) y (10.49). Aparte de
la posicion medida experimentalmente (lnea continua), tambien se muestra
(linea interrumpida) la respuesta obtenida en simulacion con el sistema sin
perturbaciones + 30.8018 + 1140.9 = 1140.9d el cual responde de acuerdo
a las especificaciones de diseno: tr = 0.068[s] y Mp ( %) = 20 %, pues sus polos
estan ubicados en s = 15.4009 j30.0623.
El diseno del controlador PID clasico se realiza de acuerdo a la expuesto
en la seccion 5.2.5, es decir, usando los parametros de la planta:

k = 675.4471, a = 2.8681

los polos deseados ubicados en:

s = 15.4009 j30.0623

para conseguir un tiempo de subida de 0.068[s] y un sobre paso de 20 %, el


parametro de diseno = 0.01, y (5.42), (5.44) se obtienen las ganancias:
10.3 Control bajo el efecto de perturbaciones externas 551

kd = 0.0414, kp = 1.6896, ki = 0.0169

Es importante subrayar que de acuerdo al metodo de diseno presentado en


la seccion 5.2.5, el valor = 0.01 se elige muy cercano a cero para que la
respuesta transitoria ante la referencia de posicion tenga las caractersticas
deseadas lo cual, puede observarse en la figura 10.10, es conseguido para el
primer cambio tipo escalon de la referencia (antes de que aparezca alguna
perturbacion externa). Sin embargo, los problemas aparecen una vez que se
aplica la perturbacion externa:
El uso de un valor pequeno para resulta en una ganancia integral muy
pequena lo cual produce un ajuste integral tan lento que el efecto de la per-
turbacion no es compensando en la figura 10.10. Es mas, aunque en t 3[s]
y t 5.5[s] la posicion medida alcanza a la posicion deseada, esto es debido a
que la perturbacion externa desaparece en esos instantes de tiempo.
Tal como se explica en la seccion 5.2.5, se pueden conseguir ganancias
integrales mas grandes si se elige un valor grande para . Por esta razon se
propone = 10, lo cual resulta en las siguientes ganancias:

kd = 0.0414, kp = 2.1027, ki = 16.8915

En la figura 10.11 se muestran los resultados experimentales correspondientes.


Notese que la desviacion debida a la perturbacion es compensada rapidamen-
te. Sin embargo, esto es conseguido al precio de producir una respuesta ante
la referencia deseada con caractersticas muy diferentes a las disenadas. Esta
es la principal desventaja del control PID clasico: no se pueden calcular de
manera exacta las ganancias que permitan conseguir simultaneamente las ca-
ractersticas deseadas de respuesta transitoria ante una referencia de entrada
y un rechazo satisfactorio de las perturbaciones externas. Por el contrario,
este problema es resuelto con el controlador disenado en las secciones 10.3.1
y 10.3.2 y cuyos resultados experimentales se muestran en la figura 10.9.
552 10 Control de posicion de un motor de CD


[rad]

i
[A]

tiempo [s]

Figura 10.10. Control de posicion con un controlador PID clasico ( = 0.01).


Resultados experimentales.


[rad]

i
[A]

tiempo [s]

Figura 10.11. Control de posicion con un controlador PID clasico ( = 10). Re-
sultados experimentales.
10.4 Seguimiento de trayectorias 553

10.4. Seguimiento de trayectorias


En esta seccion se disena un controlador que permite que la posicion del
motor alcance una posicion deseada que es variable en el tiempo, es decir,
d (t) ya no es constante sino que cambia con el tiempo. Se supone que no
existe ninguna perturbacion externa, es decir que Tp (s) = 0, y que se puede
calcular la primera y la segunda derivada de d (t), es decir d (t) y d (t) se
conocen y son continuas. Considerese el modelo (10.1) una vez que se le aplica
la transformada inversa de Laplace, con Tp (s) = 0, es decir:

+ a = ki (10.50)

Sea el siguiente controlador, calculado a partir del conocimiento de d , d y


d :

1 d2 d (t) d(t) dd (t) d(t)
i (t) = kd kp ((t) d (t)) + a
k dt2 dt dt dt
(10.51)

Notese que d(t)


dt representa la velocidad medida del motor. Sustituyendo
(10.51) en (10.50) se obtiene:

d2 (t) d2 d (t) d(t) dd (t)
+ kd + kp ((t) d (t)) = 0
dt2 dt2 dt dt
(10.52)

Defnase el error de seguimiento como (t) = (t) d (t) y su transformada


de Laplace E(s). Entonces (10.52) se puede escribir como:

d(0)
s2 E(s) s(0) + kd sE(s) kd (0) + kp E(s) = 0 (10.53)
dt
y finalmente:

(kd + s)(0) + d(0)


dt
E(s) = (10.54)
s2 + kd s + kp

De acuerdo al captulo 3 la solucion de (10.54) tiene la forma:

(t) = n (t) + f (t)

donde la respuesta forzada es cero f (t) = 0 porque la exitacion de la ecuacion


diferencial en (10.53) es cero. Por tanto, (t) = n (t) lo cual tiende a cero
conforme el tiempo crece si las dos races del polinomio caracterstico s2 +
kd s + kp tienen parte real negativa. Esta situacion es la deseable porque si
(t) tiende a cero entonces (t) tiende a d (t) conforme el tiempo crece. Por
otro lado, como el polinomio caracterstico s2 + kd s + kp es de segundo orden
554 10 Control de posicion de un motor de CD

entonces, de acuerdo a la seccion 4.2, sus dos races tienen parte real negativa
si todos los coeficientes de dicho polinomio tienen el mismo signo, es decir,
si kp > 0 y kd > 0. Este es el criterio para la seleccion de estas ganancias.
Sin embargo, debe tenerse presente que desde el punto de vista practico no
todas las ganancias as seleccionadas presentaran desempenos satisfactorios y
deberan probarse varios valores hasta obtener un buen funcionamiento. En la
figura 10.12 se muestran los resultados experimentales obtenidos cuando se
usa el motor con k = 25.26 y a = 3.5201 junto con el controlador (10.51), las
ganancias:
kp = 363.88, kd = 22
y la trayectoria deseada:
d (t) = 0.8 sin(5t) + 0.5 cos(3t) + 3.0 (10.55)
Notese que alcanza el valor deseado de posicion d (t) a pesar de que estas
variables tienen valores iniciales diferentes. Es importante mencionar que de-
bido a que se conoce la expresion para d dada en (10.55) entonces se obtienen
las expresiones correspondientes para d y d mediante diferenciacion fuera de
linea por lo que no hay problemas de ruido importantes en este caso.

[V]

i
[A]

tiempo [s]

Figura 10.12. Controlador para el seguimiento de trayectorias. La posicion del


motor esta representada por la lnea interrumpida. La lnea continua corresponde
a d (t).
10.5 Calculo numerico de los algoritmos de control 555

10.5. Calculo numerico de los algoritmos de control


Deriferenciacion numerica

Esta es la operacion que permite obtener un estimado de la velocidad para


los controladores en las secciones 10.2.1, 10.3.2 y 10.4. Sea:
dw
y= (10.56)
dt
entonces, esta operacion se puede aproximar numericamente mediante:
w(k) w(k 1)
y (10.57)
t
donde w(k) representa el valor de w medido en el instante de muestreo pre-
sente, w(k 1) es el valor de w medido en el instante de muestreo previo y
t es el periodo de muestreo utilizado. Para que se obtenga una buena apro-
ximacion t debe ser pequeno comparado con el tiempo de respuesta del
motor.

Integracion numerica

Se procede como se indica en la seccion 9.8

Compensador de adelanto

Ahora se explica como se calcula la expresion en (10.21) involucrada en


el compensador de adelanto presentado en la seccion 10.2.2. De acuerdo a
(10.56) y (10.57) se puede hacer un corrimiento en el tiempo para redefinir:

dw w(k + 1) w(k)
(10.58)
dt t
Esto se puede usar para aproximar:
v(k + 1) v(k)
v = cv(k) + (d c)e(k) (10.59)
t
y, por tanto:

v(k + 1) = [cv(k) + (d c)e(k)]t + v(k) (10.60)

Entonces, a partir de la medicion de e(k) = d (k) (k) se puede calcular


iterativamente v(k + 1) partiendo del valor inicial v(0) = 0. La forma en que
(10.60) esta expresada es muy conveniente pues permite que el primer valor
utilizado de v(k) sea cero en k = 0. Recuerdese que v(k + 1) se calcula en
el instante de muestreo presente pero solo sera utilizado hasta el instante de
muestreo proximo inmediato en el futuro.
556 10 Control de posicion de un motor de CD

10.6. Construccion del sistema de control


En la figura 10.13 se muestra el diagrama electrico del sistema de control
completo. A continuacion se listan los componentes utilizados:
Motor de CD con escobillas e iman permanente. Voltaje nominal 20[V],
corriente nominal 3[A]. Cuenta con un encoder de 400 pulsos/vuelta, el
cual se alimenta con +5[V] de CD.
Una computadora portatil Laptop con puerto USB.
Conector de USB a serie.
Microcontrolador PIC16F877A de Microchip.
Convertidor digital/analogico DAC0800LCN.
Amplificador operacional cuadruple TL084.
Amplificadores operacionales TL081.
Manejador/Receptor MAX232.
Transistores TIP141 y TIP145.

Funcionamiento

El microcontrolador PIC16F877A tiene la tarea principal de ejecutar el


algoritmo de control correspondiente. Es decir, conocido el valor deseado de
posicion d y la medicion de la posicion actual , el microcontrolador calcula
el valor de la senal de control i .
Tal como se indica en la figura 10.13, el valor de i debe aparecer a
la entrada del amplificador operacional TL081 dentro del recuadro titulado
control de corriente. Esto se consigue del siguiente modo. Primero, en el
programa listado en la seccion 10.7 se hace iast=-iast, para cambiar el signo
de i a i . El microcontrolador debe entregar un codigo digital (iastd) de
8 bits al convertidor digital/analogico de 8 bits DAC0800LCN. Para esto, el
microcontrolador realiza la operacion:

iastd = 36.4286 iast + 127

la cual obedece a la relacion mostrada graficamente en al figura 10.14. El


convertidor digital/analogico trabaja en conjunto con un amplificador opera-
cional TL081. Estos dispositivos estan conectados de acuerdo a las sugerencias
del fabricante [1]. Esto asegura que a la salida del amplificador operacional se
obtiene un voltaje cuyo valor numerico corresponde al de i . Este valor es
recibido por un amplificador operacional TL081 que se encarga de evaluar el
lazo de corriente:

ui = 100(i i)

Finalmente, el amplificador de potencia de ganancia unitaria esta constituido


por un tercer amplificador operacional TL081 junto con dos transistores de
potencia TIP141 y TIP145, conectados en simetra complementaria.
10.6 Construccion del sistema de control 557

Figura 10.13. Diagrama electrico del sistema de control de posicion basado en el


microcontrolador PIC16F877A.
558 10 Control de posicion de un motor de CD

iastd

255

127

3:5 3:5 iast

Figura 10.14. Acondicionamiento de la senal i que debe ser enviada al convertidor


digital/analogico.

El Manejador/Receptor MAX232 se encarga de enviar la posicion medida


y la senal de control i hacia una computadora portatil (a traves de un
conector USB a serie) cuyo unico proposito es el graficado de dichas variables.
A continuacion se describe la manera en que el microcontrolador PIC16F87
7A realiza la funcion de controlador. Antes que nada se debe aclarar que no
es el proposito presentar toda una exposicion de como trabaja este micro-
controlador. Lo que se presenta es una descripcion de los recursos de este
microcontrolador que se utilizan para construir los controladores bajo prue-
ba. En la siguiente seccion se presenta un listado del programa utilizado.
El microcontrolador PIC16F877A [2] es de tecnologa EEPROM, tiene una
velocidad de operacion maxima de 20 MHz y cuenta con 5 puertos de entrada-
salida configurables y 3 temporizadores. El timer TMR0 es utilizado en este
captulo para establecer el periodo de muestreo: T = 0.001[seg] (20 cuentas del
timer 0) para los experimentos en las secciones 10.1, 10.2.1 y 10.2.2, mientras
que T = 0.002[seg] (40 cuentas del timer 0) para el experimento en la seccion
10.3.2.
La posicion se mide desde el encoder usando una subrutina y se alma-
cena en la variable cuenta2 de 16 bits. La posicion en radianes se obtiene
mediante la operacion pos=cuenta2*0.0039 donde 0.0039=3.1416 rad/(2*400
cuentas). Esto es debido a que tratandose de un encoder de 400 pulsos por
vuelta, en realidad se obtienen 4400 cuentas por vuelta (por cada 2 ra-
dianes), es decir 2400 cuentas por cada radianes. Una vez calculada la
senal de control iast se entrega al convertidor digital/analogico a traves
del puerto D (PORTD=iastd). Finalmente, la posicion (a traves de la va-
riable cuenta) o la senal de control (a traves de la variable iastd) son
enviados a la computadora portatil mediante las instrucciones: putc(0xAA);
putc(cuentaH); putc(cuentaL);
10.7 Programacion del microcontrolador PIC16F877A 559

Control de corriente

Esta parte es identica a lo descrito en la seccion 9.6.1.

Amplificador de potencia

Esta parte es identica a lo descrito en la seccion 9.6.2.

10.7. Programacion del microcontrolador PIC16F877A

Se recomienda consultar la referencia [3] para una explicacion precisa de


cada una de las instrucciones que aparecen en el siguiente listado.
// Programa para comunicacin serial entre PC y proyecto Control
// Con el PIC16F877A y el compilador PCWH V3.43
#include<16f877A.h>
#device adc=10 //manejar adc de 10 bits
#include<stdlib.h>
#include<math.h>

#fuses HS,NOWDT,PUT,NOBROWNOUT,NOLVP,NOWRT,NOPROTECT,NOCPD
#usedelay(clock=20000000) //Base de tiempo (frecuencia // del
Xtal)

#use
rs232(baud=115200,XMIT=PIN_C6,RCV=PIN_C7,BITS=8,PARITY=N)//Config.
//P. Serie
//direcciones de los puertos y algunos registros
#byte OPTION= 0x81
#byte TMR0 = 0x01
#byte PORTA = 0x05
#byte PORTB = 0x06
#byte PORTC = 0x07
#byte PORTD = 0x08
#byte PORTE = 0x09
#bit PC0 = 0x07.0
#bit PC1 = 0x07.1
//------------Declaracion de variables------------//
int16 inter,cuenta;
int8 cuentaH,cuentaL,puerto,AB,AB_1,aux,cont,iastd,cont2,cont3,cont4;
float pos,error,iast,cuenta2,posm1,kp,kv,c,delta,v,kp1,ki1,kp2,kd2,ie;
unsigned int u;
//int1 ban;
//------------Rutina de interrupcion (lee encoder)------------//
#int_rb void rb_isr() {
puerto=PORTB;
AB=((puerto)&(0x30))>>4;
560 10 Control de posicion de un motor de CD

aux=AB^AB_1;
if(aux!=0)
if(aux!=3)
if(((AB_1<<1)^AB)&(0x02))
cuenta--;
else
cuenta++;
AB_1=AB;
}
//------------Programa principal------------//
void main(void) {
setup_adc(ADC_CLOCK_INTERNAL ); //ADC (reloj interno)
set_tris_a(0b11111111);
set_tris_b(0b11111111);
set_tris_c(0b10000000); //comunicacion serial
set_tris_d(0b00000000);
set_tris_e(0b11111111);
OPTION=0x07; //prescaler timer0, 1:256
PORTC=0;
TMR0=0;
cuenta=0;
AB=0;
AB_1=0;
enable_interrupts(global);
enable_interrupts(int_rb);
cont=4;
cont2=0;
cont3=0;
cont4=0;
PORTD=127; // se envia iast=0 al circuito de control
kp=1.6891;
kv=0.0414;
c=30.8018;
delta=1.6891;
v=0.0;
kp1=1.6891;
ki1=67.5659;
kp2=1.8241;
kd2=0.1006;
posm1=0.0;
ie=0.0;
while(cont2<3) // se introduce una espera de aprox 10 segundos
{
while(cont3<255)
{
TMR0=0;
while(TMR0<255)
{
}
10.7 Programacion del microcontrolador PIC16F877A 561

cont3++;
}
cont2++;
}
TMR0=0;
while(TRUE) // ciclo de control
{
cont++;
cuenta2=(signed int16)cuenta;
pos=cuenta2*0.0039; // 3.1416 rad/(2*400 cuentas)
error=1.5-pos;
/* Identificacion */
// iast=0.5*error;
/* ___________________________________________ */

/* Control proporcional con retro de velocidad */


// iast=kp*error-kv*(pos-posm1)/0.001;
/* ___________________________________________ */

/* Red de adelanto */
// iast=delta*(error+v);
// v=(-c*v+(2.8-c)*error)*0.001+v;
/* ___________________________________________ */

/* Dos grados de libertad */


iast=kp1*error+ki1*ie-kp2*pos-kd2*(pos-posm1)/0.002;
ie=ie+0.002*error;
/* ___________________________________________ */

if(iast<-3.3) // iast se restringe a [-3.3,+3.3] Amperes


iast=-3.3; // (DAC entrega en el rango [-3.5,+3.5])
if(iast>3.3)
iast=3.3;
iast=-iast; //-i*, TL081 en control de corriente
if(cont4>70) //tiempo>0.7 seg, perturbacion (-0.5) entrada
iast=iast+0.5;
iastd=(unsigned int)(36.4286*iast+127);
PORTD=iastd;
posm1=pos;
/* // descomentar si se desea enviar la posicion a la
computadora portatil (cada 10 mseg)
if(cont==5)
{
cont=0;
inter=(cuenta)&(0xFF00);
cuentaH=inter>>8;
cuentaL=(cuenta)&(0x00FF);
putc(0xAA); //reconocimieno al puerto serial
putc(cuentaH); //mandando cuenta al puerto serial
562 10 Control de posicion de un motor de CD

putc(cuentaL);
cont4++;
if(cont4==255)
cont4=0;
}
*/
/* // descomentar si se desea enviar la senal de control a
//la computadora portatil (cada 10 mseg)
iast=-iast; // graficar +i*
if(cont4>70) // senal control graficar sin perturbacion
iast=iast+0.5;
iastd=(unsigned int)(36.4286*iast+127);
if(cont==5)
{
cont=0;
inter=(cuenta)&(0xFF00);
cuentaH=0x00; //inter>>8;
cuentaL=(iastd)&(0xFF);
putc(0xAA); //reconocimieno puerto serial
putc(cuentaH); //cuenta al puerto serial
putc(cuentaL);
cont4++;
if(cont4==255)
cont4=0;
}
*/
PC1=1; //inicia espera del timer
while(TMR0<40) //cada cuenta=(4/FXtal)*256 seg,
// (40=2 ms, periodo muestreo)
{
}
PC1=0; //termina espera del timer
TMR0=0;
} //cierre del while infinito
} //cierre del main

10.8. Control basado en una computadora personal

El controlador presentado en la seccion 10.4 para el seguimiento de trayec-


torias fue probado experimentalmente usando una computadora personal y
una tarjeta adquisitora de datos. Esto debido a que el calculo de las funciones
trigonometricas seno y coseno que se requieren consumen mucho tiempo en el
microcontrolador PIC16F877A. Este problema desaparece cuando se usa una
computadora personal. A continuacion se listan los componentes principales
del sistema de control.

Computadora personal de escritorio Pentium II a 233 MHz.


10.8 Control basado en una computadora personal 563

Tarjeta adquisitora de datos PCL-812PG de Advantech [4]. Cuenta con 15


canales de entrada analogico/digital manejados por un solo convertidor AD
de aproximaciones sucesivas de 12 bits, con entrada analogica en el rango
de -5[V] a +5[V]. Dos canales de salida digital/analogico, cada uno cuenta
con un convertidor DA de 12 bits, con salida analogica en el rango de 0[V]
a +5[V]. Tambien se cuenta con dos contadores que son programados para
establecer el periodo de muestreo en un amplio rango de valores. En el
experimento de la figura 10.12 se uso un periodo de muestreo de 0.005[s].
Motor de CD con escobillas e iman permanente. Voltaje nominal de 24[V],
corriente nominal de 2.3[A].
Sensor de posicion. Potenciometro de precision de 1[KOhm], diez vueltas,
con tope.
En la figura 10.15 se presenta el diagrama de bloques del sistema de control
completo.

Acoplamiento mecanico del sensor de posicion

Dado que la medicion de la posicion del motor se realiza con un poten-


ciometro con tope, es importante preveer la posibilidad de que dicho tope sea
alcanzado pues esto puede danar al potenciometro dado el gran par que puede
desarrollar el motor. Por esta razon se utiliza un acoplamiento mecanico que
consta de un anillo de goma que se une firmemente a la flecha del motor. El
diametro de este anillo es tal que el extremo movil del potenciometro puede
entrar en el de manera mas o menos ajustada. De esta manera, si se alcanza
el tope del potenciometro, la flexibilidad del anillo de goma permite que la
flecha del motor siga girando sin danar la parte movil del potenciometro que
permanecera en reposo.

Interfaz de entrada

El potenciometro usado como sensor de posicion (figura 10.15) entrega a su


salida un voltaje en el rango de 0[V] a +5[V]. Esto es muy conveniente por-
que el convertidor de entrada analogico/digital recibe voltajes en el rango de
-5[V] a +5[V]. Ante el voltaje recibido desde el potenciometro, el convertidor
analogico/digital entrega un codigo, codigoi , en el rango de 0 a 2n = 4096
porque dicho convertidor es de 12 bits. A partir de este codigo debe recupe-
rarse una variable ua que numericamente sea igual al voltaje entregado por el
potenciometro . De acuerdo a la figura 10.16 esto puede realizarse mediante
la operacion:
10.0
ua = codigoi 5.0 (10.61)
4096.0
la cual debe ser efectuada por el programa de computadora.
564

Amplificador de potencia
Interfaz de salida Control de corriente
15V
6:72k 3:3k
5:6k 1M Q TIP 141
PCL 3:3k
CP TL081
33k
812 PG + TL081
ui
+
ud TL081
+ u 5V
+ TL081

basado en una computadora personal.


[0; 5 ] V 5:5k 33k

Q
MOTOR Sensor de
TIP 145
i
[ 3; 3 ] A 1k posicin
5V 1k
15V
1
10 Control de posicion de un motor de CD

i 5W

Realimentacin de corriente

Realimentacin de posicin

Figura 10.15. Diagrama de bloques e interfaces del sistema de control de posicion


10.8 Control basado en una computadora personal 565
ua

4096 cdigo
i

Figura 10.16. Acondicionamiento de la senal de posicion entregada por el conver-


tidor analogico/digital.

Interfaz de salida

De acuerdo a (10.1) la senal de control es la orden de corriente i la cual,


de acuerdo a las especificaciones del motor, bien puede tomar valores en el
rango de -3[A] a +3[A]. Esta senal es calculada por la computadora, la cual
enva el dato a la tarjeta adquisitora de datos quien debe entregar el valor de
i como una senal de voltaje analogico.
Una vez que el programa de computadora calcula i , mediante el uso del
algoritmo de control correspondiente, se utiliza un conjunto de instrucciones
que independientemente del valor de i este se restringe al rango [-3,+3][V].
Despues, sabiendo que el convertidor digital/analogico es de 12 bits, se cons-
truye el esquema mostrado en la figura 10.17 para encontrar que el valor de
i debe enviarse al convertidor digital/analogico mediante un codigo calcu-
lado como (esto se realiza en el programa de computadora):
4096
codigoo = (i ) + 2048 (10.62)
6
Como resultado de esta orden el convertidor digital/analogico entregara un
voltaje analogico ud en el rango de 0[V] a +5[V]. As que se debe utilizar
un circuito analogico de interfase que adapte este voltaje en el rango 0[V]
a +5[V] al rango de -3[V] a +3[V] que son los valores que tomara i . De
acuerdo a la figura 10.18 esto se consigue con un circuito analogico, basado
en amplificadores operacionales, que realice la siguiente operacion:
6
i = ud 3 (10.63)
5
566 10 Control de posicion de un motor de CD

Esta es la funcion que realiza el bloque interfaz de salida de la figura 10.15


1
. La razon de que deba aparecer i como resultado de todas las operaciones
descritas tiene que ver con la compatibilidad de signos que deben respetar los
circuitos que en la figura 10.15 se colocan a continuacion del punto senalado
con i .

cdigo 0

4096

2048

3 3 ( i)

Figura 10.17. Acondicionamiento de la senal i que debe ser enviada al conver-


tidor digital/analogico.

( i)

5 ud
3

Figura 10.18. Diseno de la interfaz analogica que debe ser colocada a la salida del
convertidor digital/analogico.

1
Todos los amplificadores operacionales usados en la figura 10.15 son TL081. Los
tres primeros tienen la terminal + conectada a tierra mientras que el conectado
a las bases de los transistores tiene la terminal + conectada a ui .
10.8 Control basado en una computadora personal 567

Control de corriente

El amplificador operacional mostrado en el bloque control de corriente


de la figura 10.15 realiza la operacion indicada en (9.14) con K = 30.

Amplificador de potencia

Esta parte es identica a lo expuesto en la seccion 9.6.2.

Programa de computadora

Todos los algoritmos de control fueron programados en Borland C++. A


continuacion se lista el codigo utilizado.
#include <stdio.h>
#include <conio.h>
#include <math.h>

#include <stdlib.h>
#include <string.h>
#include <iostream.h>

int alto,bajo,dato,salida,i;

volatile float Ts=0.005;//Periodo de muestreo

/*------------------variables para encoder----------*/


//volatile int alto_dig=0,bajo_dig=0,dato_dig=0;
volatile float y,ir,ym1,v,dv,nv,e,ninte;

volatile float inte,gc1,gc2,tiempo,perturbacion;


/*--------------------------------------------------*/

volatile float r_des=1.0,Kp=1.9434,Kv=0.1777;


//volatile float gama=2.3853,c=12.2734,b=4.8935;
volatile float gama=2.0465,c=10.3672,b=3.8935;

volatile float kp1=1.9434,ki1=9.7170;

volatile float kp2=1.3878,kd2=0.3195;


volatile long double y0;
/*-Direccion base y periodo de muestreo para la tarjeta--*/

int base=0x210;//Direccion base de la tarjeta

int lsb1=0x00;//Periodo de muestreo

int msb1=0x01;//Periodo de muestreo


568 10 Control de posicion de un motor de CD

int lsb2=0x00;//Periodo de muestreo

int msb2=0x01;//Periodo de muestreo

volatile float yy[3000];


volatile float uu[3000];

volatile float ref[3000];


FILE *fp;
char Direccion[30];

void Inicializa(void);

void EscribeArchivo(float datos1,floatdatos2,float datos3);

void Cierra(void); void main()


{
clrscr();

/*---------Se programa la tarjeta adquisitora--------*/

/*---Vease manual PCL 812-PG de Advantech------*/

outportb(base+11,6);
//CAD iniciada con reloj y transferencia dato por software
outportb(base+9,0);// ganancia 1

outportb(base+10,15);// Canal AD No. 15


outportb(base+3,0x77);//Programacion periodo de muestreo
outportb(base+1,lsb1);//Programacion periodo de muestreo
outportb(base+1,msb1);//Programacion periodo de muestreo
outportb(base+3,0xb7);//Programacion periodo de muestreo
outportb(base+2,lsb2);//Programacion periodo de muestreo
outportb(base+2,msb2);//Programacion periodo de muestreo
i=1;
do
// inicia ciclo de control
{
/*-------------Conversion AD----------------------------*/
do
{
} while (inportb(base+5)>15);
alto=inportb(base+5);
bajo=inportb(base+4);
dato=256*alto+bajo;
y=(10.0/4096.0)*dato-5.0;//Posicion theta
tiempo=(i-1)*Ts;
/*--------Inicia lectura de encoder---------------------*/
10.8 Control basado en una computadora personal 569

// para la configuracion de entradas digitales


/*
alto_dig=inport(base+7);
alto_dig+=0xff+1;
bajo_dig=inport(base+6);
bajo_dig=(bajo_dig)&(0x00ff);
dato_dig=256*alto_dig+bajo_dig;
po_rad=((6.283185307*dato_dig)/1600);
// 1600 es el numero de cuentas por revolucion.
// gotoxy(10,10); printf("Posicion en radianes: %f",po_rad);
y=po_rad;
*/
/*-------Termina lectura encoder------------------------*/
if(i==1)
{ //condiciones iniciales
y0=y;
ym1=0.0;
v=0.0;
inte=0.0;
}
y=y-y0;//Salida fijada a cero
e=r_des-y;
/*------ Control proporcional + retro de velocidad------*/
/*
ir=Kp*(r_des-y)-Kv*(y-ym1)/Ts;
*/
/*----------- Control con red de adelanto --------------*/
/*
dv=(-c*v+(b-c)*e )*Ts;
nv=v+dv;
ir=gama*(e+v);
*/
/*---------- Control dos grados de libertad ------------*/
gc1=kp1*e+inte;
gc2=kp2*y+kd2*(y-ym1)/Ts;
ir=gc1-gc2;
ninte=inte+ki1*e*Ts;
perturbacion=0.0;
if(tiempo>1.5)
{perturbacion=0.5;}
ir=-ir+perturbacion;
// Saturacion de ir [-3,3][A]
if(ir>2.9 )
{ ir=2.9; }
if(ir<-2.9)
{ir=-2.9;}
salida=floor(682.66*ir+2048.0);
bajo=salida & 0xff;
alto=salida & 0x0f00;
570 10 Control de posicion de un motor de CD

alto=floor(alto/256.0);
outportb(base+4,bajo); //Manda codigo_o al CDA
outportb(base+5,alto);
yy[i]=y;
uu[i]=ir-perturbacion;
ref[i]=r_des;
ym1=y;
v=nv;
inte=ninte;
i++;
}while (!kbhit());// Termina ciclo de control
// while (i<=3000);
ir=0.0;// Se ordena detener el motor
salida=floor(682.66*ir+2048.0);
bajo=salida & 0xff;

alto=salida & 0x0f00;


alto=floor(alto/256.0);
outportb(base+4,bajo);
outportb(base+5,alto);
// Guarda datos en un archivo en el disco duro
cout<<i<<endl;
Inicializa();
i-=1;
for(int jj=1;jj<i;jj++)
{
EscribeArchivo(yy[jj],uu[jj],ref[jj]);
}
Cierra();
}

void Inicializa(void) {
strcpy(Direccion,"c:\\motorcd\\sigue.txt");
if( (fp=fopen(Direccion,"w+")) == NULL)
{
cout<<"No se puede crear el archivo ni modo";
exit(1);
}
}

void EscribeArchivo(float datos1,float datos2,float datos3) {


fprintf(fp,"%f %f %f \n",datos1,datos2,datos3);
}

void Cierra(void) {
fclose(fp);
}
10.10 Preguntas de repaso 571

10.9. Resumen del captulo


Se ha mostrado como controlar la posicion de un motor de CD bajo el
efecto de una perturbacion externa de par. Para esto se han construido dos
controladores: uno es un controlador PID clasico y el otro es un controla-
dor PID modificado. Aunque ambos controladores resuelven el problema, el
controlador PID modificado presenta un mejor desempeno. Como este contro-
lador necesita el valor numerico de los parametros del motor, se explica como
identificar de manera experimental tales parametros. En este captulo se ha
mostrado como sintonizar el controlador PID clasico usando el valor numerico
de los parametros del motor. Sin embargo, la principal ventaja de este contro-
lador es que puede ser sintonizado a prueba y error sin necesidad de conocer
tales valores numericos (vease la seccion 5.3 del captulo 5). Por ultimo, se ha
construido un controlador PD para el seguimiento de trayectorias. Esta es una
tarea compleja que necesita del conocimiento de los parametros del motor. Se
ha explicado de manera detallada como construir estos controladores usando
un microcontrolador y una computadora personal. La razon de usar una com-
putadora personal es la construcion del controlador PD para el seguimiento
de trayectorias ya que se requiere del calculo de funciones sinusoidales del
tiempo lo cual consume demasiado tiempo si se utiliza un microcontrolador.
Cuando se construye un sistema de control en la practica, es muy impor-
tante que el procesamiento de las senales que realiza el software y el hardware
utilizados corresponda fielmente a las operaciones matematicas que indica el
controlador. El sistema de control que se ha construido ha sido elaborado
teniendo muy en cuenta este aspecto y la cuidadosa descripcion del mismo
lo demuestra. Los autores pensamos que, desafortunadamente, en el medio
academico con mucha frecuencia se construyen sistemas de control de manera
un tanto descuidada. Es decir, cuando se controla la posicion de un motor
de CD con frecuencia a la gente solo le interesa que el motor se mueva hacia
donde se desea y poca antencion se presta a verificar que la respuesta tran-
sitoria es la esperada. Normalmente la parte transitoria de la repuesta es la
mas afectada por las inconsistencias introducidas en el software y el hardware
a la hora de procesar las senales correspondientes.

10.10. Preguntas de repaso

1. Considere el control PID de posicion de un motor de CD Que pasara si


la perturbacion y/o la posicion deseada no fueran constantes?
2. En robots industriales se usan controladores PID para el seguimiento de
trayectorias en lugar de controladores PD Como cree que se pueda con-
seguir esto? Que ventajas cree que tenga el uso de controladores PID en
lugar de controladores PD?
3. Como afectan las ganancias de un controlador PID clasico a la respues-
ta de un sistema de control de posicion? Si el efecto de la perturbacion
572 10 Control de posicion de un motor de CD

externa es compensada lentamente Que ajustara en las ganancias del


controlador PID para acelerar este proceso?
4. En el captulo 9 se ha visto que un controlador PI es adecuado para
compensar el efecto de perturbaciones externas de par en sistemas de
control de velocidad Por que cree que en sistemas de control de posicion
se deba usar un controlador PID en lugar de un controlador PI?
5. Mencione algunas ventajas y desventajas de usar microcontroladores y
computadoras personales para construir controladores digitales.
6. Un motor de CD tambien se puede controlar sin usar un lazo de corriente
si se supone que la inductancia de armadura es despreciable (sobre todo
en motores pequenos) Que cambios tendra que hacer a los circuitos de
las figuras 10.13 y 10.15 para trabajar sin lazo de corriente?
7. Describa el procedimiento presentado en este captulo para la identifica-
cion experimental de los parametros de un motor de CD.
8. Que es un compensador de adelanto?
9. Cuales son las ventajas y las desventajas de usar compensadores de ade-
lanto como controladores de posicion?
10. En teora, la respuesta de un sistema de control de posicion se puede hacer
tan rapida y tan amortiguada como se desee usando un controlador PID
Que problemas pueden presentarse en la practica si las ganancias de un
controlador PID son muy grandes?
Referencias

1. DAC0800 8-bit Digital-to-Analog Converter, Data sheet, National Semiconduc-


tor Corporation, 1995.
2. PIC16F877A Enhanced Flash Microcontroller, Data sheet, Microchip Techno-
logy Inc., 2003.
3. Custom Computer Services Incorporated, CCS C Compiler Reference Manual,
2003.
4. PCL-812PG Users Manual, Advantech, Taiwan, 1996.
5. K. Ogata, Ingeniera de Control Moderna, 4a. edicion, Pearson Prentice-Hall,
Madrid, 2003.
6. N.S. Nise, Sistemas de control para ingeniera, 1a. edicion en espanol, 1a. Re-
impresion, CECSA, Mexico, 2004.
7. J. Chiasson, Modeling and High-performance control of electric machines, IEEE
Press-Wiley Interscience, New Jersey, 2005.
8. Parker Automation, Position systems and Controls, Training and Product Ca-
talog DC-ROM, Compumotors Virtual Classroom, 1998.
11
Control de un sistema de levitacion magnetica

Los sistemas de levitacion magnetica son equipos que permiten que un


cuerpo hecho de material ferromagnetico flote o levite en el espacio sin
tener contacto alguno con los otros cuerpos que lo rodean. El secreto es el uso
de una fuerza magnetica producida por un poderoso electroiman. La principal
razon para producir tal fenomeno es el hecho de que, al no haber contacto
mecanico, el cuerpo que levita puede moverse sin que exista friccion y, por
tanto, desgaste. Este fenomeno es utilizado actualmente en multiples aplica-
ciones, quiza la mas conocida es la de algunos trenes de alta velocidad.
576 11 Levitacion magnetica

Objetivos del captulo

Construir la totalidad de las partes que componen a un sistema de levita-


cion magnetica.
Construir un controlador PID usando electronica analogica.
Aplicar los conceptos de control clasico a una planta que es inestable por
naturaleza.
Identificar de manera experimental los parametros de un sistema relativa-
mente complejo.
Actualmente los sistemas de levitacion magnetica son muy importantes
debido a la gran cantidad de aplicaciones que tienen. A estos equipos tambien
se les conoce como MagLev, por la abreviacion del termino ingles Magnetic
Levitation System. Una de las principales razones para el uso de sistemas de
levitacion magnetica es su capacidad para eliminar la friccion entre las partes
mecanicas que lo forman. Algunos ejemplos de aplicacion son los trenes de alta
velocidad que viajan flotando sobre un riel con el cual no tienen contacto [1],
los rodamientos magneticos [2] que pueden eliminar la friccion y el consecuente
desgaste de las piezas mecanicas involucradas y la construccion de sistemas de
posicionamiento de gran exactitud [3] gracias a que se elimina la friccion no
lineal. Dada la importancia practica de estos mecanismos, con frecuencia son
utilizados como sistemas experimentales para probar el desempeno de tecnicas
de control clasicas y avanzadas [4], [5], [6], [7], [8], [9].
En este captulo se disena un sistema de levitacion magnetica sencillo que
puede ser visto como al principio de funcionamiento de las aplicaciones men-
cionadas previamente. En la figura 11.1 se muestra el sistema de levitacion
magnetica de interes. Este sistema consiste de una esfera de material ferro-
magnetico que es atrada hacia arriba por la fuerza magnetica debida a un
electroiman. Esta esfera metalica tambien recibe el efecto de la fuerza debida
a la gravedad dirigida hacia abajo. Se desea suspender o levitar a la esfera a
una distancia del iman que pueda ser fijada a voluntad. Sin embargo, el prin-
cipal problema para conseguirlo es que este sistema es claramente inestable
como se explica a continuacion. Suponga que el electroiman ejerce sobre la
esfera metalica una fuerza hacia arriba de magnitud constante e igual a la que
ejerce la gravedad hacia abajo. Entonces las fuerzas se cancelan exactamen-
te y la esfera metalica permanecera suspendida en el espacio. La experiencia
indica que la fuerza del electroiman es mayor conforme se esta mas cerca de
el, mientras que la fuerza de la gravedad es siempre la misma. Suponga ahora
que, por alguna razon, la esfera se desplaza un poco hacia arriba respecto de
la posicion en donde se encontraba flotando. Esto hace que la fuerza del elec-
troiman sea mayor que la fuerza de gravedad, por lo que la esfera sera atrada
hacia el electroiman hasta quedar pegada al mismo. Por otro lado, si la esfera
se desplaza ligeramente hacia abajo respecto de la posicion en donde se en-
contraba flotando, entonces ahora es la fuerza de la gravedad la que vence y la
esfera caera hasta el suelo. Una situacion como la recien descrita es muestra
11 Levitacion magnetica 577

de la inestabilidad de un sistema: cuando se perturba ligeramente a un siste-


ma inestable, las variables del mismo se alejaran del lugar en que inicialmente
estaban.

electroimn

y=0
F y

m
esfera
mg

Figura 11.1. Sistema de levitacion magnetica.

Las variables y parametros involucrados son los siguientes:


u es el voltaje aplicado en las terminales del electroiman.
i es la corriente electrica a traves del devanado del electroiman.
y es la posicion de la esfera medida entre la superficie inferior del elec-
troiman y la parte superior de la esfera. Esta distancia es cero cuando la
esfera toca al electroiman y crece (positiva) conforme la esfera se mueve
hacia abajo alejandose del electroiman.
F es la fuerza magnetica ejercida por el electroiman sobre la esfera. Su
sentido se define en el mismo sentido en el que y crece. Mas adelante se
mostrara que F es negativa por lo que representa correctamente una fuerza
de atraccion.
m es la masa de la esfera.
L representa la inductancia del devanado del electroiman. La inductancia
cambia con la posicion de la esfera y se acostumbra usar la notacion L(y)
para subrayar este hecho.
R es la resistencia del cobre con el que esta construido el devanado del
electroiman.
es el flujo magnetico concatenado por el devanado del electroiman y
esta dado como = L(y) i.
578 11 Levitacion magnetica

11.1. Modelo matematico no lineal


Modelo del subsistema electrico

Notese que el circuito electrico del electroiman esta formado unicamente


por un circuito RL serie en el que aparecen el voltaje aplicado u, la inductancia
y la resistencia del devanado del electroiman (vease la figura 11.1). Aplicando
la Ley de Kirchhoff de voltajes se tiene:
X
voltaje aplicado = cadas de voltaje en la malla
u = cada en la inductancia + cada en la resistencia
d
u= +Ri (11.1)
dt
donde se ha usado la Ley de Faraday para expresar que la cada en la in-
ductancia esta dada por la variacion respecto al tiempo del flujo concatenado
d
dt .
El flujo concatenado se relaciona con la corriente electrica a traves de la
inductancia del siguiente modo = L(y) i, donde la inductancia L(y) no
es constante sino que es una funcion de la posicion de la esfera y. Como se
vera mas adelante, es importante saber como depende la inductancia de la po-
sicion de la esfera. En [7], [8] pp.245, [10] pp. 31, se sugiere que la inductancia
esta dada como:
k
L(y) = k0 + y (11.2)
1+ a

donde a, k0 y k son constantes positivas. Es interesante darse cuenta de que k0


y k0 + k representan, respectivamente, los valores de la inductancia cuando la
esfera no esta presente (y ) y cuando la esfera esta pegada al electroiman
(y = 0). Por tanto, conforme la esfera se aleja del electroiman la inductancia
L(y) variara como se muestra en la figura 11.2. El parametro a representa
la rapidez con que la inductancia vara entre k0 + k y k0 conforme crece
y. Es importante mencionar que la expresion (11.2) es propuesta de manera
emprica para ajustarse al comportamiento mostrado en la figura 11.2 y, por
tanto, no es la unica manera de representar a L(y). Otra funcion que tambien
se propone con frecuencia es [11], [12]:
y
L(y) = k0 + ke a (11.3)

Puede elegirse cualquiera de las funciones en (11.2) o (11.3) para represen-


tar a L(y) siempre que se obtenga el mejor ajuste a los datos experimentales.
En la seccion 11.4.2 se explica como realizar un experimento para identifi-
car los parametros de la inductancia. En este trabajo se continuara usando
el smbolo general L(y) para representar la inductancia con el fin de que
el lector tenga la posibilidad de utilizar los resultados aqu expuestos para
11.1 Modelo matematico no lineal 579

L (y)

k0 + k

k0

Figura 11.2. La inductancia del electroiman como funcion de la posicion de la


esfera.

cualquiera de los casos en (11.2) y en (11.3). Solamente en la parte final del


diseno, cuando se necesiten calcular valores numericos muy especficos, se pro-
cedera utilizar (11.2) porque con esta expresion se obtuvo el mejor ajuste a
los datos experimentales (vease la seccion 11.4.2).

Modelo del subsistema mecanico

Un paso importante para obtener el modelo del subsistema mecanico es


la determinacion de la fuerza magnetica, F , ejercida por el electroiman sobre
la esfera. Esta fuerza, dirigida en el sentido en el que y crece, esta dada por
(2.46). Esta expresion se reescribe a continuacion para facilidad de referencia
y, dicho sea de paso, tambien puede ser consultada en los trabajos previos [7],
[10] pp. 31, [11], [12]:

E(i, y)
F = , (11.4)
y
1
E(i, y) = L(y) i2 (11.5)
2
donde E(i, y) es la energa magnetica almacenada en el sistema magnetico
completo (electroiman y esfera).
Aplicando la Segunda Ley de Newton a la esfera se obtiene el modelo del
subsistema mecanico (vease la figura 11.1):
580 11 Levitacion magnetica
X
masa aceleracion = fuerzas sobre la esfera
d2 y
m = fuerza del electroiman + peso de la esfera
dt2
d2 y
m 2 = F (i, y) + mg
dt
d2 y 1 L(y) 2
m 2 = i + mg (11.6)
dt 2 y
donde se han usado (11.4) y (11.5) para escribir:

1 L(y) 2
F (i, y) = i
2 y
El lector puede usar cualquiera de las expresiones en (11.2) y (11.3) para
verificar la siguiente propiedad:
L(y)
<0 (11.7)
y
para todo valor positivo de y, es decir, para cualquier posicion de la esfera
que pueda ser alcanzada en la practica. Notese que el peso mg favorece el
incremento de y por lo que debe aparecer con signo positivo en (11.6). Por
otro lado, la fuerza F (i, y) tambien aparece afectada con un signo positivo
porque se define en la direccion en la que y crece. Sin embargo, su valor
negativo debido a (11.7) implica que su efecto es en contra del incremento de
y, es decir, en direccion opuesta al peso de la esfera. Por tanto, la propiedad
en (11.7) es indispensable para que la esfera pueda levitar venciendo el efecto
de la gravedad.
Por otro lado, se debe considerar el uso de un amplificador de potencia
a la entrada del electroiman (vease la seccion 9.2) y un lazo de corriente, es
decir u = Ap (i i) donde Ap es la ganancia del amplificador de potencia,
es la ganancia proporcional del lazo de corriente e i es la corriente que se
desea circule a traves del electroiman. El proposito de usar un lazo de corriente
puede explicarse sustituyendo u = Ap (i i) en (11.1):

d
Ap (i i) = +Ri (11.8)
dt
Si se elige un valor grande de entonces:

1 d
i i = +Ri 0
Ap dt

por lo que se puede considerar que i = i , es decir, que la corriente en el


electroiman es igual a la corriente que se ha ordenado. La ventaja de esto es
que ahora el sistema de control es robusto contra cambios de parametros en
la dinamica electrica dada en (11.1). Por ejemplo, la resistencia del devanado
11.2 Modelo lineal aproximado 581

puede tener variaciones (incrementos) importantes debidas al calor producido


por la gran corriente electrica que normalmente se necesita para hacer levitar
la esfera. Si la resistencia crece, entonces la corriente (y por tanto, la fuerza
del electroiman sobre la esfera) disminuye. Esto requiere aumentar el voltaje
aplicado para incrementar la fuerza del iman sobre la bola. Como consecuen-
cia, se incrementa el valor de la corriente, aumentando el calor disipado y, por
tanto, la resistencia vuelve a crecer. Finalmente el voltaje aplicado sera tan
grande que alcanzara el valor de saturacion del amplificador de potencia y,
entonces, la esfera ya no podra levitar. Al usar el lazo de corriente se con-
sigue que la corriente sea igual a la corriente deseada u ordenada, i = i ,
independientemente de los cambios en la resistencia o algun otro parametro
en (11.1).
Sustituyendo = L(y)i en (11.8) se obtiene:

di L(y)
L(y) = Ap i r i y i (11.9)
dt y
donde se ha definido r = R+Ap . Entonces, el modelo del sistema de levitacion
magnetica completo esta dado por:

di L(y)
L(y) = Ap i r i y i (11.10)
dt y
d2 y 1 L(y) 2
m 2 = i + mg (11.11)
dt 2 y

El modelo matematico en (11.10), (11.11), es no lineal porque incluye fun-


ciones inversas de y y funciones cuadraticas de i. Estas caractersticas no
permiten el uso de la transformada de Laplace para disenar el controlador.
Una manera de resolver este problema es encontrando un modelo lineal que
represente, al menos de manera aproximada, al modelo no lineal en (11.10),
(11.11). Sin embargo, este modelo aproximado y el controlador obtenido a
partir de el solo seran de utilidad en una region de tamano reducido.

11.2. Modelo lineal aproximado


11.2.1. Obtencion de un modelo en variables de estado

De acuerdo a lo expuesto en la seccion 7.1, dado un conjunto de ecuaciones


diferenciales como (11.10), (11.11), se puede encontrar una representacion en
variables de estado definiendo las componentes del vector de estado x como
las variables incognita de dichas ecuaciones diferenciales y sus primeras q 1
derivadas, donde q es el orden de la ecuacion diferencial correspondiente. La
incognita en (11.10) es i y la ecuacion es de primer orden, por tanto, solo
i califica como componente del vector de estado. Por otro lado, la incognita
en (11.11) es y y la ecuacion es de segundo orden, por tanto y y y califican
582 11 Levitacion magnetica

como componentes del vector de estado. De acuerdo a lo anterior, se propone


el siguiente vector de estado:

x1 i
x = x2 = y (11.12)
x3 y

Es importante aclarar que i no es una variable de estado sino la variable


de control, es decir, ahora es la entrada del sistema de levitacion magnetica.
Sustituyendo en (11.10), (11.11), las variables definidas en (11.12) se puede
escribir:

1 L(x2 )
x1 = Ap i r x1 x3 x1
L(x2 ) x2
x2 = x3
1 L(x2 ) 2
x3 = g + x1
2m x2
Usando notacion vectorial se obtiene:

x = f (x, i ) (11.13)

1 L(x )
f1 (x, i ) Ap i r x1 x2 x3 x1
2

L(x2 )
f (x, i ) = f2 (x, i ) = x3 (11.14)
f3 (x, i ) g+ 1 L(x2 )
x1 2
2m x2

De acuerdo a la seccion 7.2.2, los puntos de operacion son las parejas (x , io )


que satisfacen:

1 L(x )
L(x ) Ap io r x1 x22 x3 x1 0
2
f (x , io ) = x3 = 0 (11.15)

1 L(x2 ) 2
g + 2m x2 x1 0

L(x )
donde L(x2 ) y x22 indican que dichas funciones estan evaluadas en x2 = x2 .
Entonces se obtiene:

x3 = 0 (11.16)
s
2mg
x1 = L(x )
(11.17)
x22
r
io = x (11.18)
Ap 1
L(x )
Recuerdese que x22 > 0, debido a (11.7). El valor de x2 = yd se propone
ya que representa la posicion en la que se desea hacer levitar a la esfera.
11.2 Modelo lineal aproximado 583

11.2.2. Aproximacion lineal

De acuerdo a (7.29), (7.30), (7.31) en la seccion 7.2.2, el modelo no lineal


dado en (11.13), (11.14) puede ser aproximado por el siguiente modelo lineal:

z = Az + Bv (11.19)
f1 (x,i ) f1 (x,i ) f1 (x,i )

x1 x2 x3
f2 (x,i ) f2 (x,i ) f2 (x,i )
A= x1 x2 x3
f3 (x,i ) f3 (x,i ) f3 (x,i )
x1 x2 x3 x=x ,i =i
o

f1 (x,i )
i
f2 (x,i )
B= i
f3 (x,i )
i x=x ,i =i
o

donde z = x x y v = i io . Usando (11.14) se obtiene:


Ap
a11 0 a13 L(x2)
A = 0 0 1 , B= 0 , (11.20)
a31 a32 0 0
r 1 L(x2 )
a11 = , a13 = x

L(x2 ) L(x2 ) x2 1
1 L(x2 ) 1 2 L(x2 ) 2
a31 = x1 , a32 = x1
m x2 2m x22

Recuerdese que el punto de operacion x = [x1 x2 x3 ]T , io , representa cua-


tro valores escalares constantes. Usando la transformada de Laplace en cada
renglon de (11.19) junto con los valores dados en (11.20) se obtiene:

1 Ap a31
Z1 (s) = [a13 Z3 (s) + V (s)], Z2 (s) = 2 Z1 (s),
s a11 L(x2 ) s a32
sZ2 (s) = Z3 (s) (11.21)

donde Z1 (s), Z2 (s), Z3 (s), V (s) representan las transformadas de Laplace de


las funciones del tiempo z1 = x1 x1 , z2 = x2 x2 , z3 = x3 x3 y v = i io ,
respectivamente. Combinando las expresiones en (11.21) se obtiene:
a31 Ap
Z2 (s) 2)
L(x
= 3 2
(11.22)
V (s) s a11 s (a32 + a31 a13 )s + a11 a32

La funcion de transferencia en (11.22) representa el modelo lineal aproximado


que sera utilizado para estudiar y disenar un controlador que permita levitar
la esfera. Recuerdese que, de acuerdo a la seccion 7.2, todo lo que se obtenga a
partir del uso de (11.22) solo sera valido si x e i permanecen cerca del punto
de operacion (x , io ).
584 11 Levitacion magnetica

11.3. Construccion del prototipo


A continuacion se describe la manera en que fueron construidas las partes
principales del sistema de levitacion magnetica.

11.3.1. Esfera

La esfera debe ser de material ferromagnetico y, a la vez, debe ser suficien-


temente ligera. Por otro lado, con el fin de facilitar la medicion de su posicion,
la esfera no debe ser demasiado pequena. Estos requerimientos fueron satisfe-
chos seleccionando una esfera de unisel de tamano adecuado (aproximadamen-
te 0.03[m] de diametro), de acuerdo al sensor de posicion que sera construido,
y se procedio a cubrir toda su superficie con material ferromagnetico. Esto
ultimo se consiguio insertando pequenas tachuelas de acero sobre la superfi-
cie de la esfera. Aunque no se consiguio una superficie esferica perfectamente
lisa (quedan espacios no ferromagneticos entre las tachuelas), sin embargo,
los resultados muestran que lo obtenido es suficiente. Con el fin de evitar el
desprendimiento de las tachuelas estas se insertaron agregando pegamento.

11.3.2. Electroiman

Se utilizo un transformador al cual se le realizaron las siguientes modifi-


caciones. Como la mayora de los transformadores, el transformador original
constaba de un nucleo formado por laminas en forma de E las cuales estaban
colocadas en forma encontrada. Esto permite formar un circuito magnetico con
dos ramas con una dispersion despreciable de las lneas de campo magnetico.
Se procedio a desmontar el nucleo para colocar todas las laminas en forma
de E en una sola direccion como se muestra en la figura 11.1. Esto permi-
te que la esfera al levitar cierre convenientemente el circuito magnetico del
electroiman generandose de esta manera una fuerza magnetica de atraccion
del electroiman sobre la esfera. El devanado del electroiman se construyo en-
rollando alambre magneto del numero 19. Esto debe hacerse de manera que
las espiras queden perfectamente acomodadas una a lado de la otra, sin que
quede una sobre la otra, y formando tantas capas como lo permita el espacio
libre que hay en las laminas en forma de E. Las dimensiones del transformador
utilizado fueron seleccionadas mediante experimentacion: una vez que se ha
seleccionado la esfera a levitar se verifica si, con las fuentes de alimentacion de
las que se dispone, el transformador es capaz de generar una suficiente fuerza
de atraccion sobre la esfera. Tambien debe verificarse que el calentamiento del
electroiman obtenido no sea exagerado.

11.3.3. Sensor de posicion

El componente principal es una simple fotorresistencia que se conecta en


serie con una resistencia fija para formar un divisor de tension (vease la figura
12:5V
t Vt

47000pF 10k 1N4001


15V
10k
10k 6:8k
TL081 +
TL081 LM339

+ u L(y)
+

+
TIP141

1N5404
1N4001

i
1
5W
12:5V 1k 10k
R2 C2
47k
10k 100k
2:2pF 2:2pF
R1 2:2pF 2:2pF
A 10k
B
TL082 10k
+ TL082 1k

v TL082
+

C1 + TL082

Ad
=
sensor +

posicin 15V 15V T1
y
15V
i = v + i o
10k 10k 10k
1k
V P1 1k
yv 1k i

Figura 11.3. Diagrama electrico del sistema de control completo.


11.3 Construccion del prototipo

y v
d
Ao
585
586 11 Levitacion magnetica

11.3). La fotorresistencia se coloca dentro de una pelota de Ping-Pong para


aprovechar la dispersion de luz que su superficie consigue. De esta manera,
aunque la fotorresistencia es relativamente pequena, sin embargo se obtiene
una variacion uniforme de la luz que incide sobre ella en un amplio rango
de posiciones de la esfera. En este sentido, el diametro de la esfera de unisel
utilizada para construir la esfera en la seccion 11.3.1 es igual al diametro
de la pelota de Ping-Pong. El conjunto se coloca en un extremo de un tubo
metalico de 0.10[m] de longitud cuyo diametro se ajusta perfectamente a la
pelota de Ping-Pong. Las paredes interiores del tubo se cubren con cartulina
negra. La parte de la pelota de Ping-Pong que queda fuera del tubo se pinta de
negro. Todo esto permite disminuir la posibilidad de interferencias luminosas.
Frente al otro extremo del tubo se coloca una lampara de luz visible. El
conjunto se coloca del siguiente modo. Cuando la esfera toca al electroiman la
luz de la lampara es completamente obstruida y la fotorresistencia no recibe
luz, por lo que su resistencia es muy grande. Conforme la esfera se aleja
(hacia abajo) del electroiman la cantidad de luz que llega desde la lampara
hasta la fotorresistencia aumenta, por lo que su resistencia disminuye cada vez
mas. Esto permite que el voltaje en el punto yv de la figura 11.3 aumente al
aumentar la posicion de la esfera (crece al alejarse la esfera del electroiman).
Es interesante darse cuenta que no es necesario un sistema optico basado
en algun tipo de luz no visible (infrarroja) si se asegura que se ha reducido
considerablemente la posibilidad de interferencias luminosas. El voltaje yv
representa la medicion en volts de la posicion y en metros (recuerdese que
y = x2 ). El valor deseado de posicion se fija con el voltaje yv en la figura 11.3
mediante el uso de un potenciometro. Las dos resistencias entre los puntos
yv y yv de la figura 11.3 permiten que el voltaje VP 1 en la misma figura
sea igual a 12 z2v , donde z2v = yv yv es el error de posicion medido en
volts (vease el ejercicio 5 en el captulo 2). Para obtener estos resultados es
recomendable que cada una de estas resistencias (de 10[KOhm]) sean varias
veces mas grandes que las resistencias que estan en serie con la fotorresistencia
y con el potenciometro que fija a yv . Por otro lado, las dos resistencias de
10[KOhm] deben ser al menos seis veces mas chicas que el valor de R1 . La
relacion entre z2v y el error de posicion medido en metros z2 = x2 x2
esta dada por la ganancia del sensor optico As , es decir:

z2v = As z2 (11.23)

11.3.4. Controlador

De acuerdo a lo visto en la seccion 8.2, el amplificador operacional colocado


entre los puntos A y B de la figura 11.3 constituye un controlador PID que,
ademas, introduce un cambio de signo. Mas adelante, en este captulo, se
explica como seleccionar los valores de R1 , R2 , C1 y C2 .
11.4 Identificacion experimental de los parametros del modelo 587

11.3.5. Lazo de corriente

Los dos amplificadores operacionales que siguen a T 1, en la figura 11.3, son


utilizados para construir el lazo de corriente que efectua la operacion (i i),
valor que es entregado al amplificador de potencia justo en el diodo rectificador
colocado a la entrada del comparador LM339. Este diodo y la resistencia de
10[KOhm] sirven para evitar que sean aplicados voltajes negativos a la entrada
del comparador, los cuales pueden aparecer debido al ruido presente en el
circuito y a la alta ganancia del lazo de corriente = 100.

11.3.6. Amplificador de potencia

Como amplificador de potencia se utiliza un modulador por ancho de pulso


(PWM). Este amplificador consta de un circuito que genera una senal trian-
gular cuyo voltaje Vt vara entre 0[V] y 12.5[V] (parte superior de la figura
11.3). La frecuencia de esta senal determina la frecuencia base del PWM y
se selecciono de 1.53[KHz]. Como se explica en la seccion 11.5, este valor de
frecuencia satisface los requerimientos de diseno. La senal triangular se com-
para (LM339, en la figura 11.3) con la senal de (i i) entregada por el lazo
de corriente para generar la senal modulada por ancho de pulso, la cual se
aplica a la base de un transistor NPN TIP141 que se encarga de conectar y
desconectar un voltaje de potencia de Vs =12.5[V] (vease la figura 11.3). Este
amplificador de potencia se modela como una ganancia de valor dado como:
Vs 12.5
Ap = = =1 (11.24)
voltaje pico a pico de Vt 12.5

11.4. Identificacion experimental de los parametros del


modelo

11.4.1. Resistencia del electroiman, R

Se aplica sucesivamente un conjunto de voltajes de CD en las terminales del


eletroiman y se mide la corriente electrica resultante. Estas parejas de valores
se grafican en la figura 11.4 con el smbolo + y se les ajusta una linea recta.
La pendiente de esta linea recta corresponde al valor de la resistencia R. As,
se encuentra que R = 2.72[Ohm].

11.4.2. Inductancia del eletroiman, L(y)

Se coloca la esfera en diferentes posiciones, y, medidas desde la parte infe-


rior del electroiman hasta la parte superior de la esfera. Para cada una de estas
posiciones se mide, usando un puente RLC, la inductancia en las terminales
del electroiman, L(y). Dado que la frecuencia de operacion del electroiman
588 11 Levitacion magnetica

u
[V]

i [A]

Figura 11.4. Medicion experimental de R.

sera de 1.53[KHz], debido a la frecuencia del amplificador de potencia tipo


PWM, estas mediciones de inductancia fueron realizadas usando una frecuen-
cia de 1[KHz] en el puente RLC. Esta es la frecuencia mas cercana a 1.53[KHz]
que permite seleccionar el puente RLC utilizado. En la figura 11.5 se mues-
tran graficados con el smbolo + los datos experimentales encontrados. A
continuacion se proponen diferentes conjuntos de valores para los parametros
k0 , k, a y con cada uno de ellos se calcula la funcion L(y) dada en (11.2)
para los valores de y utilizados en el experimento. En la figura 11.5 se mues-
tran con lnea continua los valores de L(y) que mejor se ajustaron a los datos
experimentales. Los parametros utilizados para conseguir este ajuste son:

k0 = 36.3 103 [H], k = 3.5 103 [H], a = 5.2 103 [m] (11.25)

11.4.3. Ganancia del sensor de posicion, As

Se coloca la esfera a diferentes distancias, y, respecto de la superficie infe-


rior del electroiman. Para cada una de estas posiciones se mide el voltaje yv
de la figura 11.3. En la figura 11.6 se grafican con el smbolo + los datos
experimentales obtenidos. A estos puntos se les ajusta una lnea recta que
resulta tener una pendiente de 100[V/m]. Esto significa que la ganancia del
sensor es:
11.4 Identificacion experimental de los parametros del modelo 589

L(y)
[H]

y [m]

Figura 11.5. Identificacion experimental de los parametros k, k0 y a que definen a


L(y) en (11.2).

yv z2v
As = = = 100[V/m] (11.26)
y z2
Notese que la ganancia del sensor tambien relaciona a z2v y z2 si se selecciona
yv = 100x2 (recuerdese que y = x2 y que x2 = yd ). Se puede apreciar que
el comportamiento lineal del sensor ocurre para valores mayores a y = 0.005
[m].

11.4.4. Masa de la esfera, m

Usando una balanza digital se encontro que m = 0.018[Kg].


590 11 Levitacion magnetica

yv
[V]

y [m]

Figura 11.6. Identificacion experimental de As .

11.5. Diseno del controlador


Primero se debe calcular el punto de operacion deseado. Esto se consigue
proponiendo el valor deseado de posicion x2 = yd = 0.01[m] y usando (11.16),
(11.17), (11.18) para encontrar x1 = 2.1174[A], x3 = 0[m/s], io = 2.1749[A].
Por otro lado, el amplificador operacional marcado con T 1 realiza la ope-
racion i = v + io , donde v es la senal entregada por el controlador. Este
amplificador operacional introduce una ganancia adicional de valor Ad = 4.7,
la cual debe considerarse como una ganancia en cascada con el controlador.
Usando los valores numericos mostrados en la seccion 11.4, en (11.24), as co-
mo = 100, se puede hacer uso de las expresiones en (11.20) para encontrar
que la funcion de transferencia en (11.22) esta dada como:
Z2 (s) 24710
= 3 (11.27)
V (s) s + 2739s2 1250s 3.536 106
Defnase la siguiente variable:
1
(s) = V (s) (11.28)
Ad
Entonces usando (11.27), (11.28) y Ad = 4.7 se puede escribir:
Z2 (s) 24710 4.7
= 3 (11.29)
(s) s + 2739s2 1250s 3.536 106
11.5 Diseno del controlador 591

Los polos correspondientes estan ubicados en:


s1 = 35.9, s2 = 2739.4, s3 = 35.9 (11.30)
lo cual implica que el sistema de levitacion magnetica es inestable en lazo
abierto, tal como se haba pronosticado al principio del presente captulo. Por
esta razon, el principal proposito de disenar un controlador consiste en con-
seguir que el sistema de control completo sea estable en lazo cerrado. El polo
en s2 = 2739.4 corresponde a la parte electrica del sistema de levitacion
magnetica y es muy grande comparado con los otros dos polos (correspon-
dientes a la parte mecanica) debido a que se esta usando un lazo de corriente
de alta ganancia ( = 100). Sin embargo, con el fin de seleccionar la frecuencia
correcta para el amplificador de potencia por modulacion de ancho de pulso se
debe obtener el polo correspondiente a la dinamica electrica antes de aplicar
el lazo de corriente. Regresando a (11.1) y usando = L(y)i, se encuentra:
di L(y)
L(y) =uRi y i
dt y
Dado que se trata de una ecuacion diferencial de primer orden en la variable i,
a partir de esta expresion se concluye que la constante de tiempo de la dinami-
L(x )
ca electrica en lazo abierto (en el punto de operacion) esta dada por R2 .
Por tanto, el polo de lazo abierto (antes de aplicar el lazo de corriente) de la
R
dinamica electrica esta en s = L(x ) = 72.5384. Esto significa que el ancho
2
de banda de la planta a controlar es 72.5384[rad/s] ya que los otros dos polos,
correspondientes a la parte mecanica, son mas cercanos al origen en el plano
s. Es importante asegurar que la planta solo respondera al valor medio de la
senal modulada por ancho de pulso entregada por el amplificador de poten-
cia. Esto se consigue si la frecuencia del amplificador de potencia 1.53[KHz],
cuando se expresa en radianes por segundo, es muy grande comparada con
72.5384[rad/s] lo cual es cierto porque:
72.5384[rad/s] 1.53 103 2 = 9613[rad/s]
Finalmente, una caracterstica importante de la funcion de transferencia en
(11.29) es que tiene ganancia negativa. Esto se debe a que incrementos en la
variable de entrada producen decrementos en la variable de salida y viceversa,
como se explica a continuacion. Si la corriente ordenada i aumenta, es decir
si v = i io crece, entonces aumenta la fuerza del electroiman sobre la esfera
por lo que esta sube y su posicion z2 = x2 x2 disminuye.
En la figura 11.7(a) se muestra el diagrama de bloques propuesto del sis-
tema de control completo. Notese que se esta utilizando realimentacion po-
sitiva de la salida. La razon por la que se propone este diagrama de bloques
sera comprendida conforme se realice el analisis que sigue a continuacion.
Notese que se pueden combinar (11.23) y (11.29) para obtener:
Z2v (s) 24710 4.7As
= 3
(s) s + 2739s2 1250s 3.536 106
592 11 Levitacion magnetica
Ganancia Amp:
Controlador del sumador potencia
= Avd Electroiman
yv + i + u
G c(s) Ad Ap
z2v = yv yv
+
+

io
i
Ad
1 y

Sensor
optico
yv Esfera
As

(a)
Sistema de
Controlador levitacion
(s) = VA( sd ) Z2v (s) = Yv (s) Yv (s)
G c(s) G(s)

(b)
Sistema de
Controlador levitacion
0 + (s) Z2v (s)
G c(s) G ( s)
Z2v (s) = Yv (s) Yv (s)

(c)

Figura 11.7. Diagramas de bloques equivalentes del sistema de control.

donde Z2v (s) es la transformada de Laplace de z2v . Finalmente, usando As =


100 dado en (11.26) se encuentra:
Z2v (s)
= G(s) (11.31)
(s)
11613700
G(s) =
s3 + 2739s2 1250s 3.536 106
Usando esta funcion de transferencia, el diagrama de bloques de la figura
11.7(a) puede representarse como en la figura 11.7(b) el cual, a su vez, pue-
de representarse como en la figura 11.7(c). Este ultimo diagrama de bloques
es importante porque tiene la forma de un sistema en lazo cerrado con rea-
limentacion negativa para el cual existen muchas herramientas de analisis y
diseno de controladores como el lugar de las races y las tecnicas de respuesta
11.5 Diseno del controlador 593

en frecuencia. Notese que este diagrama implica que se esta usando una re-
ferencia deseada de valor cero para la variable de salida z2v . Aunque parezca
extrano, esto tiene una razon muy importante: si z2v = 0 entonces, de acuerdo
a (11.23), z2 = x2 x2 = 0, lo que implica que x2 = x2 , es decir, que la esfera
alcanza la posicion deseada. Notese tambien que para obtener el diagrama de
bloques de la figura 11.7(c) es fundamental utilizar realimentacion positiva
as como la estructura del diagrama de bloques que se muestra en la figura
11.7(a), lo que justifica su uso. Otra manera de explicar el uso de dicha rea-
limentacion positiva es la necesidad de compensar la ganancia negativa que
tiene la funcion de transferencia del sistema de levitacion magnetica Z(s)2v (s)

dada en (11.31).
La funcion de transferencia de lazo abierto en la figura 11.7(c) es:

Gc (s)G(s) (11.32)
(s)
con G(s) dada en (11.31) y Gc (s) = Z2v (s) es la funcion de transferencia del
controlador que se disenara.

11.5.1. Un controlador proporcional

Supongase primero que se usara un controlador proporcional, es decir que


Gc (s) = kp donde kp es una constante positiva. La funcion de transferencia
de lazo abierto es:
11613700
kp (11.33)
s3 + 2739s2 1250s 3.536 106
mientras que la funcion de transferencia de lazo cerrado esta dada como:

kp s3 +2739s211613700
1250s3.536106
11613700 kp
1+ s3 +2739s2 1250s3.536106
11613700 kp
= (11.34)
s3 + 2739s2 1250s 3.536 106 + 11613700 kp

Notese que sin importar el valor que tome kp no se puede afectar el signo
del termino 1250s en el denominador de esta funcion de transferencia. Esto
implica que siempre hay al menos un coeficiente del polinomio caracterstico de
dicha funcion de transferencia que tiene signo contrario a los otros coeficientes
lo cual, de acuerdo a la seccion 4.2 significa que hay al menos un polo de lazo
cerrado en el semiplano complejo derecho, es decir, el sistema en lazo cerrado
es inestable.
En un caso como este es necesario un controlador que contribuya con
un cero a la funcion de lazo abierto. Esto sugiere el uso de un controlador
proporcional-derivativo (PD). Sin embargo, es importante subrayar lo siguien-
te. De acuerdo a (11.17) y (11.18), el valor de io es utilizado para compensar
594 11 Levitacion magnetica

de manera exacta el efecto de la gravedad y as conseguir que el error en estado


estacionario sea cero, es decir que y = yd cuando el tiempo sea suficientemente
L(x )
grande. Por tanto, cualquier incertidumbre en los valores de mg, de x22 o
de la ganancia Ad resultara en un error de estado estacionario diferente de
cero. Una manera eficiente de resolver este problema es usando un controlador
que incluya una accion integral sobre el error de posicion. Por esta razon, a
continuacion se disena un controlador PID.

11.5.2. Un controlador proporcional-integral-derivativo (PID)


El controlador propuesto tiene la siguiente forma:
k
!
s2 + kdp s + kkdi
Gc (s) = kd (11.35)
s

En la seccion 5.2.7 se ha encontrado el lugar de las races correspondiente a la


funcion de transferencia de lazo abierto Gc (s)G(s) con G(s) dada en (11.31)
y Gc (s) dada en (11.35) cuando se elige:
kp ki 31.24
= 31.24, = (11.36)
kd kd 0.8
De acuerdo a lo encontrado en la seccion 5.2.7, todos los polos de lazo cerrado
tienen parte real negativa para valores de kd que satisfacen kd > 0.01. En la
tabla 11.1 se muestran los valores seleccionados de kd y las correspondientes
ganancias del controlador PID obtenidas usando (11.36).
El controlador PID se construye usando el amplificador operacional colo-
cado entre los puntos A y B de la figura 11.3. De acuerdo a la seccion 8.2, las
ganancias de este controlador estan dadas como:
R2 C1 1
p = + , d = R2 C1 , i = (11.37)
R1 C2 R1 C2
Por otro lado, en la seccion 11.3.3 se indico que las dos resistencias de
10[KOhm] conectadas al punto VP 1 introducen una ganancia igual a 1/2. Co-
mo esta ganancia debe ser considerada como parte del controlador en (11.35)
se concluye que:
p d i
kp = , kd = , ki = (11.38)
2 2 2
Usando (11.37) y (11.38) se calculan los valores de R1 , R2 , C1 y C2 mos-
trados en la tabla 11.1. En esa misma tabla se muestran los valores que se
usaron experimentalmente para estos elementos de circuito. Estos valores se
consiguieron combinando resistencias y capacitores de los siguientes valores
comerciales: 330[KOhm] y 330[KOhm] (en paralelo), 22[KOhm] y 47[KOhm]
(en serie), 47[KOhm] y 33[KOhm] (en serie), 470[KOhm] y 330[KOhm] (en
serie), varios capacitores de 0.1[F] en paralelo, un capacitor de 1[F] y dos
capacitores de 1[F] en serie.
11.6 Resultados experimentales 595

Tabla 11.1. Valores numericos probados experimentalmente.


kd Ganancias PID Valores calculados Valores experimentales
R1 = 323.34[K] R1 = 330[K]
kd = 0.0396
R2 = 766.59[K] R2 = 800[K]
0.0396 kp = 1.2371
C1 = 0.10331[F] C1 = 0.1[F]
ki = 1.5464
C2 = 1[F] C2 = 1[F]
R1 = 161.67[K] R1 = 165[K]
kd = 0.0792
R2 = 766.59[K] R2 = 800[K]
0.0792 kp = 2.4742
C1 = 0.20663[F] C1 = 0.2[F]
ki = 3.0928
C2 = 1[F] C2 = 1[F]
R1 = 107.78[K] R1 = 100[K]
kd = 0.1188
R2 = 766.59[K] R2 = 800[K]
0.1188 kp = 3.7113
C1 = 0.30994[F] C1 = 0.3[F]
ki = 4.6391
C2 = 1[F] C2 = 1[F]
R1 = 80.834[K] R1 = 80[K]
kd = 0.1584
R2 = 766.59[K] R2 = 800[K]
0.1584 kp = 4.9484
C1 = 0.41326[F] C1 = 0.4[F]
ki = 6.1855
C2 = 1[F] C2 = 1[F]
R1 = 64.667[K] R1 = 69[K]
kd = 0.1980
R2 = 766.59[K] R2 = 800[K]
0.1980 kp = 6.1855
C1 = 0.51657[F] C1 = 0.5[F]
ki = 7.7319
C2 = 1[F] C2 = 1[F]

11.6. Resultados experimentales

En la figura 11.8 se muestran los resultados obtenidos experimentalmente


cuando se usan las ganancias correspondientes a kd = 0.0792. El experimento
realizado consiste en hacer levitar la esfera y una vez que alcanza el reposo se
le aplica un pequeno golpe hacia arriba a manera de perturbacion. Notese que
como respuesta a esta perturbacion la variable z2v = yv yv disminuye ini-
cialmente, lo que significa que la esfera se mueve hacia arriba para despues de
algunas oscilaciones regresar a su posicion inicial. Notese tambien que cuando
la esfera se mueve hacia arriba la corriente ordenada i disminuye ya que es
esta accion la que permite a la esfera regresar hacia abajo. Tambien se puede
observar en la figura 11.8 que 12 z2v es igual a cero en estado estacionario, es
decir que y = yd . Esto significa que, en efecto, la parte integral del controlador
cumple su funcion. Por otro lado, la corriente electrica medida en estado esta-
cionario a traves del electroiman es de 1.7[A]. Comparese con x1 =2.1174[A]
calculada al principio de la seccion 11.5.
Es conveniente advertir que las variables z2v e i mostradas en la figura
11.8 fueron obtenidas mediante el filtrado de las senales medidas debido a que
estas contenan cantidades importantes de ruido. Notese que a pesar de este
hecho el sistema construido consigue su objetivo principal: usar un controlador
para hacer estable en lazo cerrado a una planta que en lazo abierto es inestable.
596 11 Levitacion magnetica

Es conveniente aclarar que el objetivo principal del sistema de levitacion


magnetica construido es conseguir hacer levitar la esfera de una manera esta-
ble. Aunque el conseguir experimentalmente las caractersticas de respuesta
transitoria y de estado estacionario disenadas es un aspecto importante de un
controlador, sin embargo, no es el aspecto que se quiere resaltar en el proto-
tipo construido. Recuerdese que se trata de una planta altamente no lineal a
la cual se le ha disenado un controlador a partir de una aproximacion lineal
que es valida en una region de trabajo reducida cuyos lmites no estan de-
finidos explcitamente. Es por esto que las ganancias del controlador PID se
han seleccionado solo para asegurar estabilidad pero no se ha hecho nada por
disenar caractersticas de respuesta transitoria especficas.
Una muestra de como las no linealidades del sistema afectan la respues-
ta del sistema de control completo es presentada a continacion. En la tabla
11.2 se presentan los polos de lazo cerrado conseguidos con cada uno de los
valores de kd mostrados en la tabla 11.1. Notese que en todos los casos, todos
los polos de lazo cerrado tienen parte real negativa. A pesar de esto, en la
tabla 11.2 se muestra que para algunos valores de kd se observo inestabili-
dad de manera experimental. Esto significa que la esfera no pudo permanecer
levitando cuando se probaron las ganancias correspondientes en el prototipo
construido. De manera mas especfica, se encontro que para valores grandes de
las ganancias PID la esfera empieza a oscilar rapidamente hasta caer al suelo.
Estos resultados experimentales sugieren que no deben utilizarse ganancias
PID muy grandes a pesar de que el analisis teorico asegure estabilidad.
Otro aspecto interesante se observa cuando se vara el valor de yd . Utilizan-
do las ganancias correspondientes a kd = 0.0792 y partiendo de yd = 0.01[m],
se redujo yd poco a poco, es decir la esfera se acerco mas y mas al electroiman.
Conforme esto sucede la esfera empieza a vibrar y llega un momento en que
la esfera permanece levitando pero no en un valor constante de y sino descri-
biendo un movimiento oscilatorio claramente apreciable como se muestra en
la figura 11.9. Si disminuye yd aun mas, entonces la oscilacion es muy rapida y
de amplitud muy grande de modo que escapa y cae al suelo. Esto sugiere que
se espera que haya menos problemas para hacer levitar la esfera si la posicion
deseada que se propone yd es mayor, es decir si se ordena que la esfera levite
mas alejada del iman. Esta conjetura es aun mas respaldada por el hecho de
que al usar kd = 0.1584 (que produce inestabilidad experimentalmente para
yd = 0.01[m]) se consigue estabilidad, es decir que la esfera levita, cuando se
usa un valor de yd mayor de que 0.01[m]. Sin embargo, esto tambien tiene un
lmite ya que la fuerza del electroiman disminuye al alejarse la esfera.
Finalmente, en la figura 11.10 se muestra una fotografa del sistema de
levitacion magnetica funcionando donde se alcanza a apreciar el electroiman
y el sistema optico usado para la medicion de la posicion de la esfera.
11.6 Resultados experimentales 597

Tabla 11.2. Polos de lazo cerrado para los valores de kd usados cuando yd = 0.01[m].

Polos de Comportamiento
kd
lazo cerrado experimental
2562.0
149.4
0.0396 estabilidad
26.2
1.8
2353.6
355.8
0.0792 estabilidad
28.4
1.5
2088.3
620.6
0.1188 estabilidad
29.0
1.4
1635.3
1073.5
0.1584 inestabilidad
29.3
1.4
1354.3 + j617.1
1354.3 j617.1
0.1980 inestabilidad
29.4
1.4

Figura 11.8. Resultados experimentales con el sistema de levitacion magnetica


cuando yd = 0.01[m]. Trazo superior: 21 z2v . Trazo inferior: i , corriente ordenada.
598 11 Levitacion magnetica

Figura 11.9. Resultados experimentales con el sistema de levitacion magnetica


cuando se usa un valor deseado de posicion menor que 0.01[m]. Trazo superior:
1
z . Trazo inferior: i , corriente ordenada.
2 2v

Figura 11.10. El sistema de levitacion magnetica funcionando.


11.8 Preguntas de repaso 599

11.7. Resumen del captulo


En este captulo se ha construido un sistema de control de levitacion
magnetica usando exclusivamente electronica analogica. El controlador uti-
lizado es un PID y se ha construido usando amplificadores operacionales de
acuerdo a lo expuesto en la seccion 8.2 del captulo 8. Como el sistema es no
lineal por naturaleza, es necesario obtener un modelo lineal aproximado que
solo sera util de manera local, es decir, el sistema de control funcionara correc-
tamente solo si el cuerpo a levitar se coloca inicialmente cerca de donde se
desea que permanezca. Para encontrar esta aproximacion lineal, es de mucha
utilidad el modelado usando las variables de estado visto en el captulo 7. Una
vez que se cuenta con un modelo lineal, se procede a disenar el controlador
PID. Esto requiere del conocimiento de los valores numericos de los parametros
del modelo lineal del sistema de levitacion. Por esta razon, tambien se explica
de manera detallada como identificar estos parametros experimentalmente.
Dado que la planta es inestable y no lineal, este es un problema cuya puesta
a apunto en la practica es un tanto compleja. Esto significa que se debe poner
mucha atencion en considerar todas las ganancias introducidas por cada uno
de los elementos del circuito de control cuando se haga el modelado y el diseno
del controlador. Errores en este aspecto frecuentemente resultan en un mal
funcionamiento del sistema de control.
Es muy importante resaltar que la construccion del prototipo que se ha
presentado no requiere de sensores sofisticados y que tampoco es necesaria
una inversion economica importante.

11.8. Preguntas de repaso

1. Por que es recomendable usar un nucleo con forma de E para el elec-


troiman? Por que no usar un simple nucleo recto?
2. Con el fin de simplificar el problema, en algunos trabajos existentes sobre
el tema se supone que la inductancia del electroiman es constante Cree
que esto sea correcto?
3. En un sistema de levitacion magnetica el uso de un lazo de corriente tiene
ventajas importantes en el funcionamiento del sistema de control Cuales
son estas ventajas?
4. Cual es la ventaja de usar un controlador PID en lugar de un controlador
PD en este problema?
5. Que problemas cree que puedan aparecer si se usan capacitores polariza-
dos en el circuito de control?
6. Que debe hacer si desea incrementar la ganancia del amplificador de
potencia basado en modulacion por ancho de pulso?
7. Que debe hacer para incrementar la frecuencia del modulador por ancho
de pulso?
8. Para que sirve el diodo que se coloca en paralelo con el electroiman?
600 11 Levitacion magnetica

9. Que es el punto de operacion en un sistema de levitacion magnetica y


que lo determina?
10. A que atribuye que el modelo en (11.31) tenga ganancia negativa? Y por
que el polinomio en el denominador tiene algunos coeficientes con signo
negativo?
Referencias

1. J.D. Kraus, Electromagnetics, McGraw-Hill, Singapore, 1992.


2. Autores varios, Special issue on magnetic bearing control, IEEE Transactions on
Control Systems Technology, Vol.4, No. 5, 1996.
3. M.Y. Chen, C.F. Tsai, H.H. Huang, and L.C. Fu, Integrated design for a planar
MagLev for micro positioning, in Proc. American Control Conference, pp. 3066-
3071, Portland, 2005.
4. J. Levine, J. Lottin, J.C. Ponsart, A nonlinear approach to the control of mag-
netic bearings, IEEE Transactions on Control Systems Technology, vol. 4, no.
5, pp. 524-544, 1996.
5. M.G. Feemster, Y. Fang and D. Dawson, Disturbance rejection for a magnetic
levitation system, IEEE Transactions on Mechatronics, vol. 11, no. 6, pp. 709-
717, 2006.
6. J.-C. Shen H control and sliding mode control of magnetic levitation system,
Asian Journal of Control, vol. 4, no. 3, pp. 333-340, 2002.
7. R. Ortega, A. van der Schaft, I. Mareels and B. Maschke, Putting energy back
in control, IEEE Control Systems Magazine, pp. 18-33, April 2001.
8. R. Ortega, A. Lora, P. J. Nicklasson and H. Sira-Ramrez, Passivity-based con-
trol of Euler-Lagrange Systems, Springer, London, 1998.
9. M.S. de Queiroz, and D. Dawson, Nonlinear control of active magnetic bearings:
a backstepping approach, IEEE Transactions on Control Systems Technology,
vol. 4, no. 5, pp. 545-552, 1996.
10. H. Khalil, Nonlinear Systems, 3rd Edition, Prentice-Hall, Upper Saddle River,
2002.
11. W. Hurley, M. Hynes and W. Wolfle, PWM Control of a magnetic suspension
system, IEEE Transactions on Education, vol. 47, no. 2, pp. 165-173, 2004.
12. W. Hurley, W. Wolfle, Electromagnetic design of a magnetic suspension system,
IEEE Transactions on Education, vol. 40, no. 2, pp. 124-130, 1997.
12
Control de un sistema Ball and Beam

baln
R
varilla r
F = mgsen

mg

Figura 12.1. Sistema ball and beam.

El sistema ball and beam es un prototipo didactico muy popular en siste-


mas de control. Si se considera el modelo completo del mecanismo se encuentra
que es no lineal y que es difcil de controlar debido al efecto centrfugo que
sufre el baln como resultado del giro de la varilla. Sin embargo, este fenome-
no es importante solo cuando la velocidad de la varilla es muy grande. Si se
supone que la varilla y el baln se mueven a bajas velocidades y si la varilla
solo describe angulos cercanos a la horizontal entonces el modelo es lineal y
resulta ser un buen banco de pruebas para las tecnicas de control clasico.
604 12 Control de un sistema Ball and Beam

Objetivos del captulo

Construir la totalidad de las partes que componen a un sistema ball and


beam y, en particular, el sensor de la posicion del baln.
Usar un microcontrolador y una computadora personal para construir un
controlador multilazo que emplea un compensador de adelanto.
Aplicar los conceptos de control clasico a una planta que es inestable por
naturaleza.
Identificar de manera experimental los parametros del mecanismo.
Considere la situacion representada en la figura 12.1. Se trata de una
varilla que cuenta con un canal dentro del cual rueda un baln. La inclinacion
de la varilla puede ser modificada usando un motor de corriente directa y
esta inclinacion genera el movimiento del baln por efecto de la gravedad.
El objetivo de control en este mecanismo es conseguir que el baln alcance
el reposo en una posicion especificada de antemano a lo largo de la varilla.
Este mecanismo es conocido en la literatura en ingles bajo el termino ball
and beam y es un prototipo muy utilizado para probar experimentalmente
diversos controladores disenados usando tecnicas clasicas y avanzadas [1], [2].
Como se muestra en este captulo, este mecanismo es inestable y los metodos
clasicos de diseno introducen el uso de un lazo interno de control. Estas son
las razones por las que se desea presentar el problema de control de este
mecanismo en el presente captulo
La nomenclatura utilizada es la siguiente:
u es el voltaje aplicado en las terminales de armadura del motor.
x es la posicion del baln medida desde el extremo izquierdo de la varilla.
es la inclinacion de la varilla respecto de la horizontal.
m es la masa del baln.
R y r representan, respectivamente, el radio del baln (esferico) y el radio
de giro del baln sobre los bordes del canal.
i es la corriente electrica de armadura.
L es la inductancia de armadura.
Ra es la resistencia de armadura.
ke es la constante de fuerza contraeletromotriz.
km es la constante de par.
Jm es la inercia del rotor del motor.
bm es la constante de friccion viscosa del motor.
JL es la inercia de la varilla.
bL es la constante de friccion viscosa de la varilla.
n1 y n2 representan el numero de dientes del engrane del eje del motor y
del eje de la varilla, respectivamente, y n = nn21 .
12.1 Modelo matematico 605

12.1. Modelo matematico


El modelo matematico que interesa es aquel que indica como se ve afectada
la posicion del baln, a lo largo de la varilla, bajo el efecto de un voltaje
aplicado en las terminales de armadura del motor.
Es importante observar que conforme el baln se desplaza sobre la varilla
el peso del primero ejerce un par de giro sobre la varilla el cual depende de
la posicion del baln sobre la varilla. Por otro lado, un fenomeno interesante
que puede ocurrir si la varilla se mueve rapidamente es el siguiente. Suponga
que el baln trata de escapar, es decir x aumenta, y se cambia rapidamente
la inclinacion de la varilla con el fin de hacerlo regresar. Sin embargo, debido
al efecto de la fuerza centrfuga el baln continuara escapando en lugar de
regresar.
Con el fin de que no aparezcan los efectos descritos en el parrafo anterior
se supondra que:
El par ejercido por el peso del baln sobre la varilla es despreciable, lo cual
es muy cercano a la realidad si el motor actua sobre la varilla a traves de
una caja de engranes con tasa de reduccion elevada.
La varilla se movera con velocidades pequenas y la inclinacion solo
tomara valores pequenos alrededor de cero.

Modelo del motor electrico y la varilla


El motor de CD y la varilla se pueden modelar como se hizo en la seccion
9.1 considerando que la carga esta representada por la varilla, es decir:
di
L = u Ra i n ke (12.1)
dt
J = b + n km i (12.2)
J = n2 Jm + JL , b = n2 bm + bL
Procediendo como en las secciones 9.1, 9.2 y 9.3 se puede usar el lazo de
corriente:
ui = K(i i)
as como el amplificador de potencia:
u = Ap ui
para encontrar que el modelo del motor de CD y la varilla esta dado como:
k
(s) = I (s) (12.3)
s(s + a)
b nkm
a= , k=
J J
donde se ha supuesto que no esta presente ninguna perturbacion externa, es
decir Tp = 0.
606 12 Control de un sistema Ball and Beam

Modelo del movimiento del baln

Considere la situacion mostrada en la figura 12.1. Se supone que cualquier


desplazamiento x del baln es producido por la inclinacion de la varilla. El
modelo matematico buscado se obtiene usando la Segunda Ley de Newton
para describir el movimiento traslacional del baln, el cual tiene dos compo-
nentes: 1) el movimiento traslacional de una partcula de masa m y 2) el
movimiento giratorio sobre su propio eje de una esfera de masa m.

baln

!
~
x

v~ r~

bordes del canal

Figura 12.2. Estudio del movimiento giratorio del baln.

Supongase primero que el baln esta fijo en el espacio y que es el canal el


que se mueve de modo que, por efecto de la friccion, hace que el baln gire (sin
cambiar su posicion en el espacio). En la figura 12.2 se muestra tal situacion
(suponiendo que x = 0). Notese que r 6= R debido a la separacion entre los
bordes del canal.
Si es la velocidad angular con que gira el baln y v es la velocidad con
que se desliza el canal hacia la izquierda, entonces:

r=v (12.4)

donde representa el producto cruz de dos vectores y las flechas sobre las
letras indican que las variables son vectores. Aprovechando que la velocidad
angular y el radio son perpendiculares, se puede escribir la expresion anterior
en terminos de los modulos de los vectores involucrados como:

r = v (12.5)
v
= (12.6)
r
12.1 Modelo matematico 607

Sea f la fuerza que ejerce el canal sobre el baln y que hace que este gire. Notese
que dicha fuerza se aplica a una distancia r del centro del baln. Entonces rf es
el par que ejerce el canal sobre el baln. Aplicando la Segunda Ley de Newton
a esta situacion se encuentra:

Jb = f r (12.7)
2 R2
f = mv 2 (12.8)
5 r
donde se ha usado (12.6) y Jb = 52 mR2 es la inercia de una esfera solida de
masa m y radio R que gira sobre su propio eje (baln) [3], [4], pag. 271.
Ahora considerese la situacion real: el canal permanece en reposo y es el
baln el que rueda con lo que su posicion x ahora cambia y la velocidad y la
aceleracion del baln estan dadas como (se supone que el baln rueda sobre los
bordes del canal sin patinar):

x = v, x = v (12.9)

Entonces, f es la fuerza equivalente que el movimiento giratorio del baln


ejerce sobre s mismo y que contribuye al desplazamiento del baln a lo largo
del canal. Con este antecedente, se puede aplicar la Segunda Ley de Newton
al movimiento traslacional del baln considerando que, ademas del efecto de
la gravedad, existe una fuerza f que el giro del baln ejerce sobre s mismo
(vease la figura 12.1):

mx = f + mg sin (12.10)

Usando (12.8), (12.9) se tiene:

2 R2
mx = mx 2 + mg sin (12.11)
5 r
2 R2
1+ x = g sin (12.12)
5 r2

Notese que la fuerza f , debida a la inercia del giro del baln, representa una
fuerza de oposicion al movimiento traslacional de baln: de acuerdo a la Pri-
mera Ley de Newton la inercia representa la oposicion que un cuerpo presenta
hacia cambios en su situacion actual de movimiento. Con el fin de representar
correctamente la oposicion de f a la traslacion del baln, f (que incluye un
signo negativo) debe aparecer sumando (y no restando) en (12.10).
Como se ha dicho previamente, se considera que siempre es muy pequena
( 0) por lo que se puede escribir:

sin (12.13)

Es importante mencionar que esta aproximacion require que el angulo


este dado en radianes [4], pag. 942. Entonces (12.12) se convierte en:
608 12 Control de un sistema Ball and Beam

2 R2
1+ x = g (12.14)
5 r2

o, usando la transformada de Laplace con condiciones iniciales cero:

X(s)
= 2 (12.15)
(s) s
g
= 2 R2
1+ 5 r2

lo cual representa el modelo del movimiento del baln.


Finalmente, el modelo del sistema ball and beam esta dado por la combi-
nacion de (12.3) y (12.15), es decir:

X(s) k
= 2, (s) = I (s) (12.16)
(s) s s(s + a)

12.2. Construccion del prototipo

En esta parte se describe la manera en que ha sido construido el prototipo


usado. A continuacion se listan los componentes principales del sistema de
control.

Computadora personal de escritorio Pentium II a 233 MHz.


Tarjeta de adquisicion de datos PCL-812PG de Advantech [5]. Cuenta con
15 canales de entrada analogico-digital manejados por un solo convertidor
AD de aproximaciones sucesivas de 12 bits, con entrada analogica en el
rango de -5[V] a +5[V]. Dos canales de salida digital-analogico, cada uno
cuenta con un convertidor DA de 12 bits, con salida analogica en el rango
de 0[V] a +5[V].
Motor de CD con escobillas e iman permanente. Voltaje nominal de 24[V],
corriente nominal de 2.3[A].
Varilla del sistema ball and beam. Compuesta por: i) una varilla de madera
de seccion circular (riel numero uno), ii) una varilla de aluminio de seccion
circular (riel numero dos), iii) una lamina de madera que sirve de soporte
para las dos varillas anteriores.
Sensor de posicion para la inclinacion de la varilla. Potenciometro de pre-
cision de 5[KOhm], una vuelta, sin tope.
Sistema de medicion de la posicion del baln. Se describe a continuacion.

En la figura 12.3 se presenta el diagrama de bloques del sistema de control


completo.
12.2 Construccion del prototipo 609
x
INTERFACES
PCL 812 PG Y MECANISMO
CP BALL AND BEAM

SISTEMA DE SISTEMA DE
MEDICIN MEDICIN
DE DE x

Figura 12.3. El bloque interfaces y mecanismo ball and beam se muestra en la


figura 12.7. El sistema de medicion de se muestra en la figura 12.6. El sistema de
medicion de x se muestra en la figura 12.4.

12.2.1. Medicion de la posicion x del baln

Una parte importante e interesante del prototipo es el sistema de medicion


de la posicion del baln. De hecho, generalmente esta es la parte que mayores
dificultades presenta a la hora de construir el sistema de control. La manera
mas comun de hacer esta medicion es utilizando una resistencia que se en-
cuentra distribuida a lo largo de uno de los rieles que conforman el canal de la
varilla. El otro riel es un conductor cuya resistencia puede considerarse igual
a cero. As, conforme el baln (hecho de material conductor de la electricidad)
rueda haciendo contacto electrico con ambos rieles, el segundo conductor tiene
un voltaje que es igual al voltaje que tiene el primer riel justo en el punto don-
de el baln hace contacto con el. De esta manera, los rieles forman en conjunto
un potenciometro y el baln constituye el contacto movil del mismo.
Debido a que el material necesario para distribuir la resistencia a lo lar-
go del primer riel puede ser difcil de conseguir en ocasiones, en esta obra
se construye un sistema de medicion diferente, el cual puede ser construido
facilmente y sus componentes son faciles de conseguir.
El riel que se denominara como numero uno esta constituido por una varilla
de madera de seccion circular de aproximadamente 0.01[m] de diametro y
0.65[m] de longitud. Sobre esta varilla de madera se devana cuidadosamente
alambre magneto de manera que las espiras queden ajustadas, una junto a
la otra, sin dejar espacio entre ellas y, a la vez, sin que una se encime a la
otra. De este modo se consigue construir una bobina cilndrica de 0.65[m] de
longitud y 0.01[m] de diametro cuya superficie externa es suficientemente lisa
como para permitir que el baln ruede sobre ella suavemente. La razon de usar
una varilla de madera para construir este riel es evitar la posibilidad de que
las espiras queden en corto circuito si el barniz del alambre magneto llegara
a danarse.
El riel numero dos es una varilla cilndrica de aluminio de 0.65[m] de
longitud y 0.01[m] de diametro. Ambos rieles se colocan uno frente al otro,
paralelos y a una distancia de 0.017[m], entre los puntos mas cercanos de los
rieles, sobre un soporte de madera (vease la figura 12.4). As, se forma un
610

0:65 [m]
soporte de madera
riel nmero dos
1N4002

0:017 [m] x canal 6:8k


baln
xv
1F

3:3k

riel nmero uno 10k


1nF + 15V
TL081
1k
12 Control de un sistema Ball and Beam

Zeners
10k TIP41
25k 4:7V
10k 1nF TIP42

Figura 12.4. Sistema de medicion de x.


10k

15V
12.2 Construccion del prototipo 611

canal de 0.65[m] de longitud y 0.017[m] de ancho. Los extremos de este canal


se obstruyen utilizando material suave como la espuma utilizada para empacar
equipo delicado para evitar que el baln escape. Este conjunto constituye la
varilla del mecanismo ball and beam.
El baln se selecciona de manera que sus dimensiones le permitan rodar
dentro del canal haciendo contacto con ambos rieles y, al mismo tiempo, que
el mismo canal evite que el baln lo abandone. Este aspecto es importante,
sobre todo en la etapa en la que se hacen los primeros ajustes experimentales
pues la varilla suele presentar movimientos bruscos que pueden hacer que el
baln salte y abandone el canal. Finalmente, se identifica la zona donde el
baln hace contacto con el riel numero uno y se raspa esa estrecha franja de
la bobina de este riel a lo largo toda la longitud. Esto permitira el contacto
electrico, atraves del baln y conforme este rueda, entre ambos rieles. El baln
utilizado tiene las siguientes dimensiones (vease la figura 12.5):

2R = 0.0238[m], 2z = 0.01895[m], r = 0.0072[m] (12.17)

0:0238 [m ]

baln

r
R

riel nmero uno riel nmero dos

0:01895 [m ]

Figura 12.5. El baln rodando entre los dos rieles.

Los extremos de la bobina del riel numero uno se conectan a una fuente
de voltaje alterno (vease la seccion 8.3.1) con forma de onda seno de 10[V]
de pico y de 16[KHz]. El uso de una frecuencia elevada ayuda a limitar la
corriente que demanda la bobina y, al mismo tiempo, reduce el voltaje de rizo
que se produce en el proceso que se describe a continuacion. El riel numero
dos se conecta a un circuito rectificador de media onda que a su vez alimenta
612 12 Control de un sistema Ball and Beam

a un circuito RC en paralelo que sirve de filtro para reducir el voltaje de rizo


del voltaje de CD que se obtiene. As, conforme el baln rueda en el canal,
la magnitud de este voltaje de CD, xv , es representativa de la posicion x del
baln a lo largo del canal.
Finalmente, se usa una caja de engranes para unir el motor de CD con
la varilla con el fin de aumentar el par aplicado sobre esta. De acuerdo a lo
expuesto la seccion 12.3, no es necesario conocer la tasa de reduccion de la
caja de engranes.

12.2.2. Medicion de la inclinacion de la varilla

El angulo de inclinacion de la varilla se mide utilizando un potenciome-


tro. Para esto, la terminal movil del potenciometro se conecta mecanicamente
a la varilla mediante dos brazos de aluminio (vease la figura 12.6). As, cual-
quier desplazamiento angular de la varilla produce un desplazamiento angular
de la terminal movil del potenciometro y, por tanto, un voltaje, v , que es re-
presentativo de la inclinacion de la varilla.

baln motor de CD

varilla terminal
mvil
+ 5V
BASE

brazos

potencimetro

Figura 12.6. Sistema de medicion de .

12.2.3. Interfaces y amplificador de potencia

Como puede verse en (12.16) la senal de control es la orden de corriente


i , la cual se restringe por software a que tome valores en el rango de -3[A] y
+3[A]. Notese que esta caracterstica y el uso de una PC junto con la tarjeta
de adquisicion de datos PCL-812PG hacen que la interfaz de salida que se
utilizara para el sistema ball and beam sea identica a la que se disena en la
seccion 10.8. Por razones similares, la interfaz de entrada que se utilizara con
12.2 Construccion del prototipo 613

el sistema ball and beam es igual a la disenada en la seccion 10.8. Finalmente,


el amplificador de potencia y el lazo de corriente que se utilizan (vease la
figura 12.7 1 ) son muy parecidos a los disenados en las secciones 9.6.2 y 9.6.1,
respectivamente.


SISTEMA

BEAM
BALL
AND

5W
1
MOTOR
u

zona muerta de transistores


TIP 141

TIP 145

Realimentacin para reducir


Amplificador de potencia

Q
15V

15V

Realimentacin de corriente
TL081

+

1k
ui
control de corriente

TL081
1M

+

i
33k

33k
[ 3; 3 ] A
i
3:3k

TL081

+
Acondicionamiento de seal

5:5k
3:3k

5V
6:72k
TL081

+
5:6k
812 PG
[0; 5 ] V
PCL

Figura 12.7. Bloque de interfaces y mecanismo ball and beam.


1
Todos los amplificadores operacionales usados en la figura 12.7 son TL081. Los
tres primeros tienen la terminal + conectada a tierra mientras que el conectado
a las bases de los transistores tiene la terminal + conectada a ui .
614 12 Control de un sistema Ball and Beam

12.3. Identificacion
12.3.1. Sistema de medicion de la inclinacion de la varilla

Se encontro que cuando la varilla se coloca en posicion perfectamente ho-


rizontal ( = 0[rad]) el potenciometro entrega 1.45[V] y cuando la varilla se
inclina 10 grados ( = 0.174[rad]) el potenciometro entrega 1.7[V]. Se veri-
fico que el sistema de medicion es lineal, es decir, que entrega incrementos de
voltaje que son proporcionales a los incrementos de angulo . Por tanto, la
ganancia del sistema de medicion esta dada como:

v (1.7 1.45)[V]
A = = = 1.43[V/rad] (12.18)
0.174[rad]

donde v es la senal de voltaje entregada por el sistema de medicion.

12.3.2. Sistema de medicion de la posicion x del baln

Cuando el baln se coloca en el extremo izquierdo del canal (x = 0[m]) el


sistema de medicion entrega 0.03[V] y cuando el baln se coloca en el extremo
derecho del canal (x = 0.65[m]) el sistema de medicion entrega 3.7[V]. Se
verifico que el sistema de medicion es lineal, es decir, que entrega incrementos
de voltaje que son proporcionales a los incrementos de la posicion del baln x.
Por tanto, la ganancia del sistema de medicion esta dada como:

xv (3.7 0.03)[V]
Ax = = = 5.64[V/m] (12.19)
x 0.65[m]

donde xv es la senal de voltaje entregada por el sistema de medicion.


Por otro lado, la identificacion experimental de los parametros que apare-
cen en el modelo (12.16) puede realizarse estudiando la dinamica del motor
y la varilla (12.3) y la dinamica del baln (12.15) por separado. Los procedi-
mientos utilizados se describen a continuacion.

12.3.3. Subsistema motor-varilla

El procedimiento utilizado en esta parte en similar al utilizado en la seccion


10.1. Se utiliza el siguiente control proporcional de posicion:

I (s) = kp A (d (s) (s)) (12.20)

donde se usa A porque v (s) = A (s) representa la variable que entrega el


sistema de medicion de la inclinacion de la varilla y es la variable que realmente
maneja la computadora utilizada como controlador en el experimento. Esto
significa que el sistema en lazo cerrado (12.3), (12.20) queda representado
como en la figura 12.8. La funcion de transferencia correspondiente es:
12.3 Identificacion 615

v (s) A kp k n2
= 2 = 2 (12.21)
vd s s + as + A kp k s + 2n s + n2
p
n = A kp k, a = 2n (12.22)
donde vd (s) = A d (s) es la inclinacion deseada en terminos del voltaje

d (s ) d (s ) I (s ) (s ) (s )
k
A kp s ( s+ a )
A
+

Figura 12.8. Control proporcional de la posicion de la varilla.

entregado por el sistema de medicion de la inclinacion de la varilla. En la figura


12.9 se presentan los resultados experimentales obtenidos cuando kp = 4.
Este experimento se realiza sin colocar el baln sobre los rieles. Midiendo
directamente en la figura 12.9 se encuentra que tr = 0.18[s] y Mp ( %) = 60.8.
Estos datos se utilizan en las expresiones:
v
u
u ln2 M p( %)
u 100
=t (12.23)
2 M p( %)
ln 100 + 2
" p !#
1 1 2
d = atan (12.24)
tr
d
n = p (12.25)
1 2
para obtener = 0.15 y n = 9.71[rad/s]. Finalmente, utilizando las expre-
siones en (12.22) con kp = 4 se encuentra:
k = 16.5134, a = 3.04 (12.26)

12.3.4. Dinamica del baln

Aplicando la transformada inversa de Laplace a (12.15) y considerando


todas las condiciones iniciales iguales a cero se obtiene:
x = (t) (12.27)
Suponga que (t) = 0 donde 0 es una constante. Integrando dos veces
(12.27):
616 12 Control de un sistema Ball and Beam

v
[V]
M p (%) = 60:8
vd


tr = 0:18

i
[A]

tiempo [s]

Figura 12.9. Resultados experimentales usando kp = 4 y el diagrama de bloques


de la figura 12.8.

1
x(t) = 0 t2 (12.28)
2
A continuacion se presenta un procedimiento que permite estimar de manera
experimental el valor del parametro .

Fije firmemente la varilla de manera que su inclinacion defina un angulo


de valor = 0 , donde 0 es un valor positivo pequeno. Un buen valor es
0 = 0.174[rad] (el equivalente a 10 grados) porque sin(0.174) = 0.173, es
decir sin(0 ) 0 .
Coloque el baln en el extremo superior de la varilla (x = 0) y dejelo rodar
libremente hasta alcanzar el extremo inferior de la varilla (la varilla no
debe moverse durante este paso). Mida la posicion que describe el baln
conforme rueda entre los extremos de la varilla. Esta tarea es facilitada si
se utiliza una PC.
Grafique contra el tiempo la posicion del baln obtenida en el paso anterior.
Usando el valor de 0 utilizado en el primer paso del experimento, proponga
un valor arbitrario de para graficar la funcion 21 0 t2 sobre los mismos
ejes utilizados en el paso anterior.
Proponga diferentes valores de . El valor correcto de es aquel que per-
mite que la grafica de los datos experimentales y la grafica de la funcion
12.4 Diseno del controlador 617

1
20 t2 coincidan durante todo el tiempo en el que se realizo el experi-
mento.
En la figura 12.10 se muestran las graficas mencionadas en el procedimiento
anterior. Se utiliza 0 = 0.174[rad] y se encuentra que:

=5 (12.29)

Es importante tener el cuidado de que el valor experimental de x que se gra-


fica este expresado en unidades de longitud (metros). Esto puede conseguirse
usando x = xv /Ax . Finalmente, es interesante mencionar que la validez de
este valor numerico se ha verificado mediante el uso de (12.15), (12.17) y
g = 9.81[m/s2 ], pues se obtiene un valor igual a 4.687 para .

[m]

1
2
0t 2

x
(experimental)

tiempo [s]

Figura 12.10. Identificacion experimental del parametro .

12.4. Diseno del controlador


Notese que el modelo de la planta (12.16) tiene tres polos en s = 0 por
lo que es inestable en lazo abierto. As, un objetivo importante del diseno
del sistema de control en lazo cerrado es conseguir su estabilidad. En la fi-
gura 12.11(a) se presenta un diagrama de bloques del sistema de control que
se disena. Este diagrama de bloques se puede representar como en la figura
618 12 Control de un sistema Ball and Beam

12.11(b). El lector puede revisar lo expuesto en la seccion 6.8.2 para entender


por que se usa este diagrama de bloques. En este problema de diseno se debe
conseguir que lmt x(t) = xd donde xd es una constante que representa la
posicion que se desea alcance el baln sobre el canal.

Xd (s) Xvd (s) E (s ) + + I (s ) k X(s)


Ax s+ b
s+ c

s ( s+ a ) s2
+ V1 (s )

(s )
k s A

(s )
A
Xv (s)
Ax

(a)
Xd (s) E (s ) + + I (s ) X(s)
Ax s+ b
s+ c
k
s ( s+ a ) s2
+ V1 (s )

(s )
k s A

(s )
A

(b)

Figura 12.11. Diagramas de bloques equivalentes del sistema de control a disenar.

Notese que la funcion de transferencia de lazo abierto del sistema mos-


trado en la figura 12.11(b) tiene dos polos en s = 0 por lo que es de tipo 2.
Entonces, como xd es constante, se asegura que lmt x(t) = xd si la funcion
de transferencia de lazo cerrado X(s)/Xd (s) es estable (veanse las secciones
3.8 y 4.4). Por tanto, el unico problema que resta es encontrar los valores
de las constantes , kv , , b y c de manera que la funcion de transferencia
X(s)/Xd (s) sea estable. A continuacion se explica como se consigue esto.
La funcion de transferencia de lazo abierto del sistema mostrado en la
figura 12.11(b) esta dada como:
Ax b s + b c kA 1
G(s)H(s) = (12.30)
cA b s + c s2 + (a + kv kA )s + kA s2
donde c > b > 0. En la figura 12.12 se muestran las graficas de Bode de
G(s)H(s) y de cada una de las funciones de transferencia que la forman.
Notese que si la constante kA es suficientemente grande, es decir si kA
s2 + (a + kv kA )s, entonces:
kA
1 (12.31)
s2 + (a + kv kA )s + kA
12.4 Diseno del controlador 619

dB

ii)
p i)
b 1 kA
0 !
v) c iv) iii)

vi)

fase
[grados]
+ 90 v) p
c kA !
0
b iv) iii)
90
180 ii)
270
360 vi)

Figura 12.12. Graficas de Bode de G(s)H(s) en (12.30).

Esto tambien puede interpretarse pensando que la funcion de transferencia


en (12.31) tiene una magnitud de 0[dB] y una fase de 0 grados. Es interesante
observar que esta situacion tambien se puede apreciar en la figura 12.12: cuan-
do kA es suficientemente grande, es decir cuando la frecuencia de corte de la
funcion de transferencia en (12.31) esta colocada muy a la derecha, este factor
de segundo orden no tiene ningun efecto sobre la respuesta en frecuencia en
lazo abierto y, entonces, puede ser despreciado.
Por tanto, si kA es grande el problema se reduce a conseguir estabilidad
en lazo cerrado de un sistema cuya funcion de transferencia de lazo abierto
esta dada como:
Ax b s + b c 1
(12.32)
cA b s + c s2
Esta es una simplificacion importante porque se elimina el atraso de fase
debido a la funcion de transferencia en (12.31), el cual puede tomar valores
entre 0 y 180 grados (en el caso de que dicha funcion de transferencia no fuera
cercana a la unidad). Esto significa que estabilizar a (12.32) requiere menos
adelanto de fase que el requerido para estabilizar a (12.30). Debe tenerse
presente que introducir mayor adelanto de fase hace mas exigente la tarea de
620 12 Control de un sistema Ball and Beam

s+b
disenar el controlador porque normalmente requiere de un compensador s+c
que es mas sensible al ruido introducido por los sensores de posicion.
Notese que se puede conseguir un valor grande de kA aumentando el
valor de pues los valores de k y A son fijos una vez que se ha construido
el prototipo. Sin embargo, un valor grande de kA tiene el efecto de de-
teriorar el desempeno del sistema de control. De hecho, durante las pruebas
experimentales que se realizaron para poner a punto el prototipo se utilizaron
valores grandes de kA y se observo que se incrementa el efecto nocivo del
ruido introducido por los sensores: el mecanismo vibra exageradamente y el
sistema de control no funciona adecuadamente. Por tanto, el valor de queda
limitado por el maximo valor permitido por el prototipo experimental aun
cuando no se consiga cumplir la condicion (12.31).
Por otro lado, si kv = 0 entonces el sistema en (12.31) estara mal amor-
tiguado porque = a/(2 kA ) sera pequeno. Esto produce un pico de
resonancia en la grafica de Bode de (12.30). El problema del pico de resonan-
cia es que incrementa el efecto de las altas frecuencias produciendo vibraciones
no deseadas en el mecanismo. Una solucion que ha dado buenos resultados en
el prototipo construido es el uso de un valor kv > 0 porque esto aumenta el
factor de amortiguamiento = (a + kv kA )/(2 kA ) del sistema en (12.31)
y, por tanto, se reduce el pico de resonancia en la grafica de Bode de (12.30).
En base a estos razonamientos y despues de varias pruebas experimentales
se encontro que los siguientes valores producen resultados satisfactorios:
= 4, kv = 0.2 (12.33)
Notese que el sistema de la figura 12.11(b), junto con los valores numericos
en (12.18), (12.19), (12.26), (12.29), (12.33) conforman un problema identico
al resuelto en la seccion 6.8.2 donde se encontro que la solucion esta dada por
el siguiente compensador:
s+b
Gc (s) = , b = 1.84, c = 13.2, = 2.6
s+c

12.5. Construccion del controlador


De acuerdo a la figura 12.11(a), el controlador que se debe construir
esta dado como:
i = [v1 v ] kv v (12.34)
donde v y v representan la senal entregada por el sensor de inclinacion
de la varilla y su derivada, respectivamente. Por otro lado, V1 (s) = L{v1 }
esta definida como:
s+b
V1 (s) = E(s)
s+c
E(s) = Xvd (s) Xv (s) (12.35)
12.6 Resultados experimentales 621

donde Xv (s) y Xvd (s) son las transformadas de Laplace de la posicion del baln
medida xv (obtenida a la salida del sistema de medicion correspondiente) y
de su valor deseado xvd , respectivamente. Procediendo como en las secciones
10.2.2 y 10.5 se encuentra que la funcion del tiempo v1 se puede calcular en
tiempo discreto como:

v1 (k) = [e(k) + v(k)]


v(k + 1) = [cv(k) + (b c)e(k)]t + v(k)

donde e(k) y v1 (k) son los valores actuales en tiempo discreto de las funciones
L{e} = E(s) y L{v1 } = V1 (s) definidas en (12.35) (es decir e(k) = xvd (k)
xv (k)) y t = 0.005[s] es el periodo de muestreo. As, se puede calcular
iterativamente el valor v(k + 1) que representa el valor de v que sera utilizado
en el proximo instante de muestreo. Esto se hace partiendo del valor inicial
v(0) = 0. Notese que v(k + 1) se calcula en el instante de muestreo presente
pero solo sera utilizado hasta el instante de muestreo proximo inmediato en
el futuro.
Finalmente, la senal v se calcula a partir de la medicion de v del siguiente
modo:
v (k) v (k 1)
v (12.36)
t
El controlador se programa en Borland C++ y se utiliza una computadora
personal y una tarjeta adquisitora de datos PCL-812PG de Advantech. Al
final de la seccion 12.6 se presenta el codigo utilizado. Se debe subrayar que
el experimento debe empezar colocando la varilla en una inclinacion tal que
= 0, con el fin de que el programa de computadora reconozca el valor
(diferente de cero) entregado por el sistema de medicion de cuando = 0.

12.6. Resultados experimentales


En la figura 12.13 se presentan los resultados experimentales obtenidos.
Se utiliza una posicion deseada xvd = 1[V] que corresponde a xd = 0.177[m].
Es importante mencionar que con el fin de obtener mejores desempenos se
ajustaron un poco las ganancias del compensador:
s+b
Gc (s) = (12.37)
s+c
de modo que b = 2.5, c = 17.7 y = 0.854. Durante estos ajustes se mantuvo
constante el factor = 0.14 disenado en la seccion 6.8.2 de manera que b/c =
2.5/17.7 = 1.84/13.2 = 0.14. Al usar b = 2.5 en lugar del valor 1.84 se consigue
reducir un poco el efecto del ruido, el cual ha mostrado ser importante en el
prototipo construido y puede ser apreciado en la figura 12.13. Dicho sea de
paso, mucho del ruido presente es debido al voltaje de rizo en el sistema de
622 12 Control de un sistema Ball and Beam

medicion de x y al contacto intermitente del baln, mientras rueda, con las


espiras del sensor correspondiente (notese que en la figura 12.13(a) el ruido
disminuye cuando el baln se detiene). Por otro lado, el valor de = 0.854
utilizado es tres veces menor que el valor de 2.6 disenado. Esto se hizo porque
se encontro que un valor grande de produce vibraciones del mecanismo
(efecto del ruido). En la figura 12.14 se muestran las graficas de Bode de
la funcion de transferencia de lazo abierto en (12.30) cuando se usa b = 2.5,
c = 17.7 y = 0.854. El margen de fase obtenido es de alrededor de 20 grados,
es decir aproximadamente el mismo margen de fase disenado originalmente.
Este pequeno margen de fase explica el gran sobre paso observado en la figura
12.13.
Finalmente, un aspecto que vale la pena mencionar es el efecto de las co-
nexiones a tierra y de las interferencias electromagneticas que ellas producen,
pues fueron varios los problemas observados (mediciones difciles de entender)
por causa de este aspecto. Se recurrio a bibliografa especializada en este tema
[6] y se corrigieron las conexiones a tierra en base a las sugerencias ah expues-
tas. De este modo se eliminaron los problemas observados. La razon por la
cual los efectos de las tierras e interferencias electromagneticas se presentaron
en este prototipo y no en los otros prototipos que se exponen en esta obra es
la longitud de los conductores utilizados para conectar el sistema de medicion
de x. Sin embargo, no fue necesario reducir dicha longitud, simplemente se
eliminaron lazos de tierras que eran innecesarios.
En la figura 12.15 se presentan los resultados obtenidos en simulacion del
diagrama de bloques en 12.11(a) cuando se usan los valores numericos en
(12.18), (12.19), (12.26), (12.29), (12.33), b = 2.5, c = 17.7 y = 0.854.
Notese el parecido existente entre los resultados de las figuras 12.13 y 12.15 a
pesar de la presencia importante de ruido tanto en la posicion medida xv como
en la senal de control i . Finalmente, se concluye que el sistema de control
cumple con su proposito: estabilizar la posicion del baln xv en un valor muy
cercano al valor deseado xvd = 1[V]. Finalmente, en la figura 12.16 se muestra
una fotografa del prototipo de sistema ball and beam construido cuando esta
funcionando.
12.6 Resultados experimentales 623

xv
[V]

v
[V]

tiempo [s]
(a)

i
[A]

tiempo [s]
(b)

Figura 12.13. Resultados experimentales obtenidos en el sistema ball and beam


construido.
624 12 Control de un sistema Ball and Beam

Bode Diagram

20

0
System: ghctrl
Frequency (rad/sec): 1.72
20 Magnitude (dB): 0.0122
Magnitude (dB)

40

60

80

100
135

180 System: ghctrl


Frequency (rad/sec): 1.72
Phase (deg): 159
Phase (deg)

225

270

315

360
0 1 2
10 10 10
Frequency (rad/sec)

Figura 12.14. Graficas de Bode de G(s)H(s) en (12.30) cuando se usa b = 2.5,


c = 17.7 y = 0.854.
12.6 Resultados experimentales 625

xv
[V]

v
[V]

tiempo [s]
(a)

i
[A]

tiempo [s]
(b)

Figura 12.15. Resultados en simulacion obtenidos con el modelo teorico del sistema
ball and beam construido.
626 12 Control de un sistema Ball and Beam

Figura 12.16. El prototipo ball and beam construido, funcionando.


12.6 Resultados experimentales 627

Codigo usado para programar el algoritmo de control


#include <stdio.h>
#include <conio.h>
#include <math.h>
#include<stdlib.h>
#include <string.h>
#include <iostream.h>
#include <dos.h>

int alto,bajo,dato,salida,i;
volatile float Ts=0.005;
//Periodo de muestreo
volatile float ir,v,dv,nv,e;

volatile float x,theta,theta0,thetam1;


/*------------------------------------------------------*/
volatile float r_des=0.09,Kp=3.0,Kv=0.2,xd=1.0;

volatile float c=17.663,b=2.50989,gama=0.854;

volatile long double y0;

/*-Direccion base y periodo de muestreo para la tarjeta-*/

int base=0x210;
int lsb1=0x00;
int msb1=0x01;
int lsb2=0x00;

int msb2=0x01;

volatile float yy[3000]; //seal de salida

volatile float uu[3000]; //seal de control

volatile float ref[3000];//seal de referencia

FILE *fp;
char Direccion[30];

void Inicializa(void);

void EscribeArchivo(float datos1,float datos2,float datos3);

void Cierra(void);

void main()
{
628 12 Control de un sistema Ball and Beam

clrscr();

/*----Se programa la tarjeta adquisitora----*/

/*---Vease manual PCL 812-PG de Advantech------*/


outportb(base+11,1);
//converc. AD iniciada con reloj
// y transferencia dato por software
outportb(base+9,0);// ganancia 1

outportb(base+3,0x77);//Control del contador


outportb(base+1,lsb1);
outportb(base+1,msb1);
outportb(base+3,0xb7);
outportb(base+2,lsb2);
outportb(base+2,msb2);
i=1;
do
/*----Inicia ciclo de control----*/
{
outportb(base+10,14);
outportb(base+12,0);
do
{
} while (inportb(base+5)>15);

alto=inportb(base+5);
bajo=inportb(base+4);
dato=256*alto+bajo;
theta=(10.0/4096.0)*dato-5.0; //theta por canal AD 14
outportb(base+10,15);
outportb(base+12,0);
do
{
} while (inportb(base+5)>15);
alto=inportb(base+5);
bajo=inportb(base+4);
dato=256*alto+bajo;
x=(10.0/4096.0)*dato-5.0; //x por canal AD 15
if(i==1)
{ //condiciones iniciales
v=0.0;
theta0=theta;
thetam1=0.0;
}
theta=theta-theta0;
/* Control proporcional Varilla*/
// ir=Kp*(r_des-theta);//-Kv*(y-ym1)/Ts;
12.6 Resultados experimentales 629

/* Control con red de adelanto */


e=xd-x;
dv=( -c*v+(b-c)*e )*Ts;
nv=v+dv;
ir=(gama*(e+v)-theta)*4.0-Kv*(theta-thetam1)/Ts;
/*-----Se mantiene a theta cercana a cero----*/
if( (theta>(0.5) )&&(ir>=0.0) )
{ ir=0.0; }
if( (theta<(-0.5) )&&(ir<=0.0) )
{ ir=0.0; }

ir=-ir;
//condicion de saturacion de seal de
if(ir>2.9 )
{ ir=2.9; }
if(ir<-2.9)
{ir=-2.9;}
salida=floor(682.66*ir+2048.0);
bajo=salida & 0xff;

alto=salida & 0x0f00;


alto=floor(alto/256.0);
outportb(base+4,bajo);
outportb(base+5,alto);

yy[i]=x;
uu[i]=ir;
ref[i]=theta;
v=nv;
thetam1=theta;
i++;
delay(5);
if (i>3000) i=3000;
}while ( (!kbhit() ) && ( i<=3000 ) );
// while (i<=3000);

ir=0.0;
// detiene el motor
salida=floor(682.66*ir+2048.0);
bajo=salida & 0xff;
alto=salida & 0x0f00;
alto=floor(alto/256.0);
outportb(base+4,bajo);
outportb(base+5,alto);
// Guarda datos en un archivo en el disco duro
cout<<i<<endl;
Inicializa();
i-=1;
for(int jj=1;jj<i;jj++)
630 12 Control de un sistema Ball and Beam

{
EscribeArchivo(yy[jj],uu[jj],ref[jj]);
}
Cierra();
}

void Inicializa(void) {
strcpy(Direccion,"c:\\ballbeam\\datos4s8.txt");
if( (fp=fopen(Direccion,"w+")) == NULL)
{
cout<<"No se puede crear el archivo ni modo";
exit(1);
}
}

void EscribeArchivo(float datos1,float datos2,float datos3) {


fprintf(fp,"%f %f %f \n",datos1,datos2,datos3);
}

void Cierra(void) {
fclose(fp);
}

12.7. Control basado en el microcontrolador


PIC16F877A
12.7.1. Construccion del sistema de control

En esta parte se utiliza un microcontrolador PIC16F877A [7] para con-


trolar al sistema ball and beam. Se debe aclarar que la parte mecanica del
prototipo tambien sufrio algunos cambios ligeros los cuales seran descritos en
lo que sigue. A continuacion se listan unicamente los componentes nuevos que
fueron introducidos.
Una computadora portatil Laptop con puerto USB.
Conector de USB a serie.
Microcontrolador PIC16F877A de Microchip.
Convertidor digital/analogico DAC0800LCN.
Amplificadores operacionales TL081.
Manejador/Receptor MAX232.
En la figura 12.17 se muestra un diagrama de bloques del sistema de control
que se construyo. El sistema de medicion de x es identico al mostrado en la
figura 12.4. Sin embargo, la ganancia que se midio para este sensor (siguiendo
un procedimiento identico al descrito en la seccion 12.3.2) es:

Ax = 5.3750[V/m] (12.38)
12.7 Control basado en el microcontrolador PIC16F877A 631
x
INTERFACES
PIC16F877A Y MECANISMO
BALL AND BEAM

SISTEMA DE SISTEMA DE
MEDICIN MEDICIN
DE DE x

Figura 12.17. El bloque interfaces y mecanismo ball and beam se muestra en la


figura 12.18. El sistema de medicion de consta de un potenciometro que se fija
directamente a la flecha del motor. El sistema de medicion de x se muestra en la
figura 12.4.

La pequena diferencia existente con respecto al valor de Ax = 5.64[V/m]


mostrado en (12.19) se atribuye a un pequeno ajuste en el potenciometro de
25[KOhm] que se encuentra en el circuito oscilador de la figura 12.4, ya que
dicho potenciometro afecta la amplitud de las senal de corriente alterna que
se aplica al sistema de medicion de x. Por otro lado, el sistema de medicion
de con que ahora se cuenta es un poco diferente al mostrado en la figura
12.6 porque ahora el potenciometro esta colocado directamente sobre el eje de
giro de la varilla y ya no se usan los brazos mostrados en la figura 12.6 para
transmitir el movimiento de la varilla al potenciometro. Como consecuencia
de esto, el valor obtenido para la ganancia del sistema de medicion de es:

A = 0.9167[V/rad] (12.39)

el cual es diferente a A = 1.43[V/rad] obtenido en (12.18). Los valores:

k = 16.6035, a = 3.3132, =5 (12.40)

fueron obtenidos usando procedimientos identicos a los descritos en las seccio-


nes 12.3.3 y 12.3.4. Notese que estos valores son casi identicos a los mostrados
en (12.26) y (12.29) porque estos componentes permanecieron sin cambio.
Finalmente, en la figura 12.18 se muestra el diagrama de electrico del sis-
tema de control basado en el microcontrolador PIC16F877A mientras que en
la seccion 12.7.4 se muestra el listado usado para programar dicho microcon-
trolador. Para una explicacion detallada de la figura 12.18 y el programa en
la seccion 12.7.4 se recomienda consultar las secciones 9.6 y 10.6 correspon-
dientes al control de velocidad y de posicion de un motor de CD. Se desea
subrayar que en este caso se usan dos canales del convertidor analogico/digital
con que cuenta el microcontrolador PIC16F877A: uno para medir la posicion
del baln y otro para medir la inclinacion de la varilla. Tambien se aclara que
la computadora portatil solo se usa para el graficado de las senales medidas
y no participa en el calculo del algoritmo de control.
632 12 Control de un sistema Ball and Beam

Figura 12.18. Diagrama electrico del sistema de control del sistema ball and beam
basado en el microcontrolador PIC16F877A.
12.7 Control basado en el microcontrolador PIC16F877A 633

12.7.2. Diseno del controlador

Se propone utilizar un esquema de control identico al presentado en la


seccion 12.4, por lo que el diagrama de bloques del sistema de control en lazo
cerrado es identico al mostrado en la figura 12.11. Los valores de ganancias:

= 12, kv = 0.2 (12.41)

fueron seleccionadas experimentalmente de modo que usando un valor cons-


tante de v1 (t) (vease la figura 12.11), es decir sin realimentar el error de
posicion del baln y sin usar la red de adelanto colocada antes de V1 (s), se
obtuviera una respuesta de que fuera rapida y con poca oscilacion. Notese
que el valor de = 12 mostrado en (12.41) es diferente de = 4 obtenido
en (12.33). Esto se debe a un mayor efecto de la friccion sobre la flecha del
motor en el prototipo remodelado, es decir en el usado en esta seccion, lo
cual resulta en una mayor zona muerta que es compensada usando un valor
mayor de la ganancia proporcional . Usando los valores en (12.38), (12.39),
(12.40), (12.41) y la funcion de transferencia de lazo abierto en (12.30) se pro-
cede a usar el lugar de las races para determinar que el uso de las siguientes
ganancias asegura estabilidad en lazo cerrado:

= 1.2, c = 20, b = 2.5 (12.42)

En la seccion 5.2.8 se explica a detalle el procedimiento seguido para obtener


estas ganancias.

12.7.3. Resultados experimentales

La construccion, utilizando herramientas de software, del controlador di-


senado en la seccion anterior se realiza como se explica en la seccion 12.5 y en
la seccion 12.7.4 se muestra el listado de como se consigue usando un micro-
controlador PIC16F877A [8]. Tambien se usa el diagrama electrico de la figura
12.18. En la figura 12.19 se muestran los resultados experimentales obtenidos
al usar dicho controlador, es decir, con las ganancias mostradas en (12.41) y
(12.42). Se puede observar que el baln alcanza el reposo en una posicion xv
muy cercana a 1[V], la cual es muy cercana al valor deseado xvd = 1[V]. La
pequena diferencia que se puede apreciar es debida a la zona muerta produ-
cida por la friccion sobre la flecha del motor. En la figura 12.20 se muestran
los resultados obtenidos en simulacion con el mismo controlador, el diagrama
de bloques en la figura 12.11 y los valores numericos mostrados en (12.38),
(12.39), (12.40), (12.41), (12.42). Notese el parecido entre las respuestas en
las figuras 12.19 y 12.20 a pesar de la presencia importante de ruido en el
prototipo experimental. Finalmente, en la figura 12.21 se muestran otros re-
sultados experimentales en los que se aprecia como el sistema de control logra
estabilizar la posicion del baln xv muy cerca del valor deseado xvd = 1[V]
a pesar de que el baln es desviado varias veces de su posicion deseada por
634 12 Control de un sistema Ball and Beam

xv
[V]

v
[V]

tiempo [s]

Figura 12.19. Resultados experimentales usando el microcontrolador PIC16F877A.

un agente externo (el baln es empujado intencionalmente con el dedo). Estos


resultados muestran que se ha conseguido satisfactoriamente el proposito del
sistema de control: estabilizar el baln muy cerca de su posicion deseada. Fi-
nalmente, en la figura 12.22 es muestra una fotografa del prototipo usado en
estos experimentos.

xv
[V]

v
[V]

tiempo [s]

Figura 12.20. Resultados en simulacion.


12.7 Control basado en el microcontrolador PIC16F877A 635

xv
[V]

v
[V]

tiempo [s]

Figura 12.21. Resultados experimentales usando el microcontrolador PIC16F877A.


Aparecen desviaciones producidas por un agente externo.

Figura 12.22. El sistema ball and beam construido.

12.7.4. Programa utilizado en el microcontrolador PIC16F877A

// Programa para comunicacion serial entre PC y proyecto Control


// Con el PIC16F877A y el compilador PCWH V3.43
#include<16f877A.h>
636 12 Control de un sistema Ball and Beam

//#device adc=10 //manejar adc de 10 bits


#include<stdlib.h>
#include<math.h>

#fuses HS,NOWDT,PUT,NOBROWNOUT,NOLVP,NOWRT,NOPROTECT,NOCPD

#use delay(clock=20000000) //Base de tiempo para retardos


//(frecuencia del Xtal)
//Config.
//P. Serie
#use rs232(baud=115200,XMIT=PIN_C6,RCV=PIN_C7,BITS=8,PARITY=N)
//direcciones de los puertos y algunos registros
#byte OPTION= 0x81
#byte TMR0 = 0x01
#byte PORTA = 0x05

#byte PORTB = 0x06


#byte PORTC = 0x07
#byte PORTD = 0x08

#byte PORTE = 0x09


#byte ADCON0= 0x1F
#byte ADCON1= 0x9F

#bit PC0 = 0x07.0


#bit PC1 = 0x07.1
//------------Declaracion de variables------------//
int16 inter,cuenta;

int8 cuentaH,cuentaL,puerto,AB,AB_1,aux;

int8 cont,iastd,cont2,cont3,cont4,t_0,t_1;

float x,xd,teta,error,iast,tiempo,c,b;

float gamma,alfa,kv,v,v1,tetam1; unsigned int u,i;


//int1 ban;
//------------Rutina de interrupcion------------//
#int_rb void rb_isr() {
puerto=PORTB;
AB=((puerto)&(0x30))>>4;
aux=AB^AB_1;
if(aux!=0)
if(aux!=3)
if(((AB_1<<1)^AB)&(0x02))
cuenta--;
else
cuenta++;
AB_1=AB;
12.7 Control basado en el microcontrolador PIC16F877A 637

}
//------------Programa principal------------//
void main(void) {
setup_adc(ADC_CLOCK_INTERNAL ); //ADC (reloj interno)
set_tris_a(0b11111111);
set_tris_b(0b11111111);
set_tris_c(0b10000000); //comunicacion serial
set_tris_d(0b00000000);
set_tris_e(0b11111111);
OPTION=0x07; //prescaler timer0, 1:256
PORTC=0;
TMR0=0;
cuenta=0;
AB=0;
AB_1=0;
enable_interrupts(global);
enable_interrupts(int_rb);
cont=0;
cont2=0;
cont3=0;
cont4=0;
PORTD=127;
xd=1.0;
tiempo=0.0;
gamma=1.2;
c=20.0;
b=2.5;
alfa=12.0;
kv=0.2;
tetam1=0.0;
v=0.0;
ADCON1=0x04;
ADCON0=0x81;
while(cont2<3)
{
while(cont3<255)
{
TMR0=0;
while(TMR0<255)
{
}
cont3++;
}
cont2++;
}
TMR0=0;
while(TRUE)
{
ADCON0=0x81; //Cambiando a CH0
638 12 Control de un sistema Ball and Beam

for(i=0;i<37;i++); /estabilizar capacitor interno


t_0=read_adc(); //leer ADC
x=0.0196*t_0;

ADCON0=0x89; //cambiando a CH1


for(i=0;i<37;i++); //estabilizar capacitor interno
t_1=read_adc(); //leer ADC
teta=0.0196*t_1-2.81;//2.81;

error=xd-x;
/* Controlador */
v1=gamma*(error+v);
v=(-c*v+(b-c)*error)*0.002+v;
iast=alfa*(v1-teta)-kv*(teta-tetam1)/0.002;
/* ___________________________________________ */
if(iast<-3.3)
iast=-3.3;
if(iast>3.3)
iast=3.3;
iast=-iast;
iastd=(unsigned int)(36.4286*iast+127);
PORTD=iastd;
tetam1=teta;

cuentaH=t_1;
cuentaL=t_0;
putc(0xAA); //reconocimieno puerto serial
putc(cuentaH); //cuenta al puerto serial
putc(cuentaL);
/*
iast=-iast;
iastd=(unsigned int)(36.4286*iast+127);
cuentaH=0x00;
cuentaL=(iastd)&(0xFF);
putc(0xAA); //reconocimienopuerto serial
putc(cuentaH); //cuenta puerto serial
putc(cuentaL);
*/
PC1=1; //inicia espera del timer
while(TMR0<40) //1 cuenta=(4/FXtal)*256 seg, 20=1 ms
{
}
PC1=0; //termina espera del timer
TMR0=0;
tiempo=tiempo+0.002;
} //cierre del while infinito
} //cierre del main
12.8 Sistema de medicion mejorado 639

12.8. Un sistema de medicion mejorado para la


posicion del baln

Durante las pruebas experimentales presentadas en las secciones 12.6 y


12.7.3, se observo que el sistema de medicion mostrado en la figura 12.4 puede
llegar a producir vibraciones rapidas de la varilla por lo que el baln puede salir
despedido. Se llego a la conclusion de que este comportamiento es producido
por el uso de una senal de corriente alterna de alta frecuencia como parte
fundamental del sistema de medicion mostrado en la figura 12.4.
En la figura 12.23 se muestra el diagrama electrico de un nuevo sistema
de medicion que elimina el problema arriba mencionado. Como se puede ob-
servar en esta figura, se continua utilizando el soporte de madera y los rieles
numero uno (alambre magneto arrollado sobre un nucleo cilndrico de made-
ra) y numero dos (varilla cilndrica de aluminio) que ya se haban utilizado en
la figura 12.4. La modificacion consiste en que el riel numero uno, el cual se
utilizaba como un inductor en la figura 12.4, ahora se utiliza como una simple
resistencia (resistencia del cobre) en la figura 12.23. Esto significa que los dos
rieles funcionan en conjunto como un simple potenciometro que en el punto
xv entrega un voltaje de CD que es proporcional a la posicion x del baln.
El valor de xv se mide utilizando uno de los convertidores analogico-digital
del microcontrolador PIC16F877A conectando la terminal etiquetada como
AN1 al pin numero 3 de dicho microcontrolador. Es importante mencionar
que, previamente, xv se hace pasar a traves de un filtro pasa bajas con fre-
cuencia de corte de 14.6148 [Hz] (R = 33[KOhm], C = 0.33[F]). Ademas,
con el fin de disminuir las posibles variaciones de xv debidas al calentamiento
del riel numero uno, el voltaje presente en la terminal etiquetada como AN3
(que se conecta al pin 5 del microcontrolador) se utiliza como el voltaje de
referencia para el convertidor analogico-digital encargado de medir xv . Tam-
bien es importante decir que, previamente, la senal entregada en AN3 se hace
pasar a traves de un filtro pasa bajas con frecuencia de corte de 4.8229 [Hz]
(R = 100[KOhm], C = 0.33[F]).
A continuacion se muestra el codigo utilizado para programar el micro-
controlador PIC16F877A a fn de realizar la tarea de leer la posicion x del
baln:
#device adc=10 //manejar adc de 10 bits
setup_adc(ADC_CLOCK_INTERNAL); //ADC (reloj interno)
setup_adc_ports(ANALOG_RA3_REF);//RA3(AN3)= referencia ADC
set_adc_channel(1);

conv=read_adc();
x=0.65*(conv-511)/1023; // posicion del balin en metros

La expresion x=0.65*(conv-511)/1023 se obtiene del siguiente modo. La


variable conv vara en el rango [0,210 -1]=[0,1023] porque el convertidor
analogico-digital esta programado para trabajar con 10 bits. Sin embargo, la
640 12 Control de un sistema Ball and Beam

Figura 12.23. Un sistema de medicion mejorado para la posicion del baln.


12.10 Preguntas de repaso 641

operacion conv-511 hace que (conv-511) tome valores en el rango [-511,512],


lo cual corresponde a valores de x en el rango de [-0.65/2,0.65/2][m] (en la
seccion 12.2.1 se especifica que ambos rieles tienen una longitud de 0.65[m]).
Entonces se debe cumplir la siguiente regla:

511 0.65/2 [m]


(conv-511) x[m]

De aqu se obtiene la expresion x=0.65*(conv-511)/1023. Por otro lado, una


mejora adicional que tambien puede contribuir a reducir el problema citado
al principio de la presente seccion es el uso de un encoder, en lugar de un
potenciometro, para medir el angulo de inclinacion de la varilla . En la seccion
10.7 se indica como programar el microcontrolador PIC16F877A para leer un
encoder.

12.9. Resumen del captulo


En este captulo se ha construido un sistema ball and beam y todas las
interfases necesarias para su control en lazo cerrado. El esquema de control
utilizado cuenta con dos lazos. El lazo interno sirve para controlar (control
proporcional con realimentacion de velocidad) el angulo de inclinacion de la
varilla mientras que el lazo externo controla la posicion del baln (compensador
de adelanto). Un aspecto interesante del prototipo construido es el que se
refiere al sensor de la posicion del baln. La idea es construir un canal formado
por dos rieles que, juntos, funcionan de manera similar a un potenciometro.
As, el voltaje entregado por los rieles es proporcional a la posicion del baln
sobre la varilla.
Se ha mostrado que el controlador puede ser disenado utilizando las dos
tecnicas fundamentales del control clasico: la respuesta en el tiempo (el lugar
de las races) y la respuesta en frecuencia (criterio de de estabilidad de Nyquist
y margenes de fase y de ganancia). Desde el punto de vista de la practica en
la construccion de sistemas de control, se ha visto que el efecto del ruido
y las correctas conexiones a tierra son muy importantes en este prototipo.
Tambien se han presentado algunos metodos experimentales interesantes para
identificar los parametros del baln y del conjunto motor-varilla. Ademas, se
ha mostrado como deben ser tomadas en consideracion las ganancias debidas
a los sensores, aspecto que generalmente es evitado durante los cursos sobre
control automatico en las instituciones educativas.

12.10. Preguntas de repaso


1. Por que se dice que el sistema ball and beam es inestable en lazo abierto?
2. Como funciona el sistema de medicion de la posicion del baln?
642 12 Control de un sistema Ball and Beam

3. De una explicacion descriptiva (no analtica) de por que se necesita con-


trolar la inclinacion de la varilla ademas de la posicion del baln.
4. Por que la masa equivalente del baln depende de los radios R y r de
acuerdo a (12.12)? Que pasara si r = 0 y que significa esto?
5. Describa el procedimiento experimental descrito en la seccion 12.3.4 para
identificar el unico parametro de la dinamica del baln Que otro proce-
dimiento puede usar para esto?
6. El sistema de navegacion automatica de un barco es muy similar a un
sistema ball and beam, donde papel de la varilla es sustituido por un
timon. En base a esto intente resolver el problema de control automatico
de la direccion de un barco.
7. Describa el funcionamiento del amplificador de potencia utilizado
8. Por que se dice que un compensador de adelanto introduce menos ruido
que un controlador PD?
9. Por que cree que para controlar la inclinacion de la varilla sea preferible
el uso de un controlador proporcional con realimentacion de velocidad en
lugar de un controlador PD?
10. En los resultados experimentales obtenidos se alcanza a observar un pe-
queno error en estado estacionario. Sin embargo, el sistema de control es
tipo 2 y la posicion deseada del baln es constante por lo que el error en
estado estacionario debera ser igual a cero Como explica esto?
Referencias

1. Quanser Inc. 119 Spy Court Markham, Ontario L3R 5H6, Canada. Available
at: http://www.quanser.com
2. P.V. Kokotovic, The joy of feedback: nonlinear and adaptive (1991 Bode Prize
Lecture), IEEE Control Systems Magazine, pp. 7-17, June 1992.
3. Hibbeler R. C., 2004, Mecanica vectorial para ingenieros. Dinamica, (10a. edi-
cion), Pearson Educacion, Mexico.
4. M. Alonso and E.J. Finn, Fsica, Addison-Wesley Iberoamericana, Wilmington,
Delaware, 1995.
5. PCL-812PG Users Manual, Advantech, Taiwan, 1996.
6. J. Balcells, F. Daura, R. Esparza y R. Pallas, Interferencias electromagneticas en
sistemas electronicos, Alfaomega-Marcombo, Serie Mundo Electronico, Mexico,
1992.
7. PIC16F877A Enhanced Flash Microcontroller, Data sheet, Microchip Techno-
logy Inc., 2003.
8. Custom Computer Services Incorporated, CCS C Compiler Reference Manual,
2003.
13
Control de un pendulo de Furuta

El pendulo de Furuta es otro prototipo didactico bien conocido en la litera-


tura de control automatico. En este mecanismo se deben controlar simultanea-
mente las posiciones de dos cuerpos, por lo que la solucion a este problema
de control es mas natural usando el enfoque de las variables de estado que el
de la funcion de transferencia. La aplicacion experimental de las tecnicas de
control moderno es la principal razon para incluir el problema de controlar
este mecanismo.
646 13 Control de un pendulo de Furuta

Objetivos del captulo

Construir un pendulo de Furuta.


Construir las interfaces necesarias para el funcionamiento del sistema de
control.
Usar un microcontrolador para construir un controlador por realimentacion
del estado.
Aplicar los conceptos de control moderno a una planta que es inestable por
naturaleza.
Identificar de manera experimental los parametros del mecanismo.
En este captulo se presenta el control de un sistema conocido como el
pendulo de Furuta. En la figura 13.1 se muestra un dibujo del pendulo de
Furuta. Este problema puede ser descrito de una manera muy ilustrativa ha-
ciendo referencia al bien conocido truco de mantener en equilibrio a una escoba
invertida colocada sobre la palma de la mano. En un pendulo de Furuta la
mano es sustituida por una varilla (conocida tecnicamente como brazo) que
en un extremo tiene colocado un motor electrico del cual recibe un par que
hace posible su movimiento. As, el brazo solo puede moverse sobre un plano
horizontal de modo que su extremo opuesto a donde se encuentra el motor
describe una circunferencia. En este extremo se coloca otra varilla (conocida
tecnicamente como pendulo) de la cual uno de sus extremos se une al extremo
libre del brazo mediante un rodamiento o algun otro dispositivo mecanico que
permite el movimiento libre del pendulo respecto del brazo. Esto significa que
no existe ningun motor colocado en esta union mecanica. Sin embargo, el ro-
damiento ah colocado restringe el pendulo a movimientos giratorios sobre un
plano perpendicular al brazo. Esto significa que el extremo libre del pendulo
solo puede describir una circunferencia cuyo centro esta en el punto donde se
unen el brazo y el pendulo.
Una de las caractersticas que hacen interesante al pendulo de Furuta desde
el punto de vista de control es que es inherentemente inestable. Esto puede
verse facilmente recordando el problema de equilibrar la escoba: esta siempre
tiende a abandonar su posicion invertida para caer al suelo. Por tanto, la
sintonizacion del controlador requerido no es una tarea trivial y requiere de
un conocimiento adecuado de las tecnicas de la Teora de Control.
Las variables y parametros involucrados en el pendulo de Furuta de la
figura 13.1 son los siguientes:
0 es la posicion angular (en radianes) del brazo medida respecto a una
posicion de referencia arbitraria.
1 es la posicion angular (en radianes) del pendulo medida respecto a su
posicion vertical invertida.
es el par generado por el motor electrico y que es aplicado sobre el brazo.
I0 es la inercia del brazo cuando gira alrededor de uno de sus extremos
mas la inercia del motor.
13.1 Modelo matematico 647

pndulo
z 1
m1

J1 l1
y

I 0; L 0 brazo

0
x

motor

Figura 13.1. El pendulo de Furuta.

L0 es la longitud del brazo.


m1 , l1 y J1 representan, respectivamente, la masa, la ubicacion del centro
de masa y la inercia del pendulo. J1 se calcula suponiendo que el pendulo
gira alrededor de su centro de masa. Notese que el pendulo esta constituido
por una varilla de masa no despreciable.
g = 9.81[m/s2 ] representa la aceleracion de la gravedad.

13.1. Modelo matematico

De acuerdo a lo descrito previamente, el pendulo de Furuta consta de dos


cuerpos que interactuan. El modelo matematico de este tipo de mecanismos
normalmente se encuentra usando las ecuaciones de Euler-Lagrange [1]. En el
caso del pendulo de Furuta las ecuaciones de Euler-Lagrange se reducen a:
d L L
= (13.1)
dt 0 0
d L L
=0
dt 1 1

El cero en el lado derecho de la ultima expresion se refiere a que no hay


ningun motor que aplique un par externo en el lugar donde se unen el brazo
y el pendulo. El lagrangiano L esta dado como:
648 13 Control de un pendulo de Furuta

L = K P (13.2)
K = K0 + K1

donde K0 es la energa cinetica del brazo, K1 es la energa cinetica del pendulo


y P es la energa potencial del pendulo. No se considera la energa potencial
del brazo porque, al moverse sobre un plano horizontal, su energa potencial
es constante y puede ser considerada igual a cero.
El calculo de la energa cinetica de un cuerpo cuya masa esta distribuida en
todo su volumen puede simplificarse si se descompone en dos partes: una parte
debida al movimiento traslacional de su centro de masa (considerado como una
partcula) y otra parte debida al movimiento giratorio del cuerpo suponiendo
que rota alrededor de su centro de masa. Sin embargo, si el movimiento del
cuerpo puede ser descrito de manera sencilla entonces no es necesaria esta
descomposicion. Por ejemplo, el movimiento del brazo es descrito facilmente
como el movimiento giratorio de una varilla alrededor de uno de sus extremos
y el giro del rotor del motor alrededor del mismo eje. Por tanto, no es difcil
encontrar que:
1
K0 = I0 2 (13.3)
2 0
Por otro lado, el movimiento del pendulo es mas complejo pues depende de
los movimientos combinados del brazo y del pendulo. En este caso es mas
conveniente descomponer el movimiento del pendulo en dos partes como se
menciono anteriormente: El movimiento del pendulo se descompone en el mo-
vimiento traslacional de una partcula de masa m1 colocada en su centro de
masa y el movimiento rotativo de una varilla que gira sobre un eje que pasa
por el centro de masa del pendulo. Por tanto:
1 1
K1 = J1 12 + m1 v1T v1 (13.4)
2 2
donde v1 es un vector que representa la velocidad traslacional del centro de
masa del pendulo, es decir:
dXx
dt Xx
v1 = dX
dt
y
, X = Xy (13.5)
dXz X
dt z

donde Xx , Xy y Xz son las coordenadas cartesianas del centro de masa del


pendulo. Esto significa que X es el vector posicion del centro de masa del
pendulo. De acuerdo a las figuras 13.2(a) y 13.2(b) se encuentra que:


Xx L0 cos(0 ) l1 sin(1 ) sin(0 )
X = Xy = L0 sin(0 ) + l1 sin(1 ) cos(0 ) (13.6)
Xz l1 cos(1 )
13.1 Modelo matematico 649

y
pndulo

centro de masa
Xy
0 l 1sen 1cos 0

l 1s
en
1
L0
L 0sen 0
brazo
0
Xx
x
L 0cos 0

l 1sen 1sen 0

L 0cos 0 l 1sen 1sen 0

(a) Vista superior.

pndulo
l 1sen 1

P=0
h centro
Xz de masa

1
l 1cos 1
l1

brazo

(b) Vista del plano perpendicular al brazo.

Figura 13.2. Relaciones geometricas en el pendulo de Furuta.


650 13 Control de un pendulo de Furuta

Usando (13.4), (13.5), (13.6) y despues de reducir terminos se encuentra:


1 1 h i
K1 = J1 12 + m1 (L0 0 )2 + (l1 0 )2 sin2 (1 ) + (l1 1 )2 + 20 1 L0 l1 cos(1 )
2 2
(13.7)

Finalmente, para calcular la energa potencial del pendulo se usa como punto
de referencia (donde P = 0) al punto donde 1 = 0. Entonces, recordando
que la energa potencial es el producto escalar del vector fuerza aplicada, es
decir el peso del pendulo m1 g, y el vector distancia que va desde el centro de
gravedad del pendulo hasta el punto donde P = 0, se tiene que:

P = hm1 g, h = l1 l1 cos(1 )

donde el signo se debe a que los vectores mencionados forman mas de


90 . Entonces:

P = m1 gl1 (cos(1 ) 1) (13.8)

Usando (13.3), (13.7), (13.8) se forma el Lagrangiano, L, de acuerdo a (13.2),


para despues sustituir en las ecuaciones de Euler-Lagrange dadas en (13.1).
Realizando las operaciones correspondientes y acomodando convenientemente
los terminos resultantes se obtiene:

M (q)q + C(q, q)q + g(q) = F (13.9)


2 2 2

I + m1 (L0 + l1 sin (1 )) m1 l1 L0 cos(1 )
M (q) = 0
m1 l1 L0 cos(1 ) J1 + m1 l12
1
2 m1 l12 1 sin(21 ) m1 l1 L0 1 sin(1 ) + 12 m1 l12 0 sin(21 )
C(q, q) =
1 m1 l12 0 sin(21 ) 0
2
0
g(q) = , F = , q= 0
m1 l1 g sin(1 ) 0 1

La expresion (13.9) constituye el modelo del pendulo de Furuta, el cual es


no lineal porque incluye funciones trigonometricas de 1 as como diferentes
productos entre las velocidades 0 y 1 .

13.2. Modelo lineal aproximado


En esta obra es de interes la aplicacion de tecnicas de control lineal, las
cuales no pueden aplicarse directamente cuando el modelo de la planta a con-
trolar es no lineal como el mostrado en (13.9). Sin embargo, existe una manera
de resolver este problema. La idea fundamental es encontrar un modelo lineal
aproximado que represente con suficiente exactitud al modelo (13.9) para des-
pues usar dicho modelo lineal aproximado en el diseno de un controlador para
el pendulo de Furuta. Sin embargo, tal como se indica en la seccion 7.2.2,
13.2 Modelo lineal aproximado 651

el controlador disenado de este modo solo sera de utilidad para equilibrar el


pendulo en su posicion invertida 1 = 0 bajo la condicion de que el pendulo
se encuentre inicialmente cerca de dicha configuracion, es decir, siempre se
debera cumplir que 1 0.
El primer paso consiste en escribir (13.9) en terminos de variables de esta-
do. De acuerdo a lo expuesto en la seccion 7.1, dado un conjunto de ecuaciones
diferenciales como (13.9), se puede encontrar una representacion en variables
de estado definiendo las componentes del vector de estado x como las variables
incognita de dichas ecuaciones diferenciales y sus primeras r 1 derivadas,
donde r es el orden de la ecuacion diferencial correspondiente. Notese que
(13.9) esta constituida por dos ecuaciones diferenciales, cada una de segundo
orden. Las incognitas en dichas ecuaciones son 0 y 1 . Por tanto, el vector
de estado puede ser seleccionado como:

x1 0
x2 0
x=
x3 = 1
x4 1

Despejese q de (13.9) y defnase:



w1 (x1 , x2 , x3 , x4 , )
q =
w2 (x1 , x2 , x3 , x4 , )
= M 1 (x1 , x3 )[C(x1 , x2 , x3 , x4 )[x2 , x4 ]T g(x1 , x3 ) + F ]
(13.10)

Una propiedad importante de la matriz M (q) = M (x1 , x3 ) es que siempre


es no singular, es decir, la matriz M 1 (x1 , x3 ) que aparece en la expresion
anterior siempre existe [2]. Entonces, la ecuacion de estado correspondiente se
puede escribir como:

x = f (x, u) (13.11)

f1 (x, u) x2
f2 (x, u) w1 (x1 , x2 , x3 , x4 , u)
f (x, u) =
f3 (x, u) =
,
u=
x4
f4 (x, u) w2 (x1 , x2 , x3 , x4 , u)

Usando las ideas de la seccion 7.2.2, ahora se obtiene un modelo lineal aproxi-
mado que es valido alrededor de un punto de operacion de interes. Los puntos
de operacion son las parejas (x , u ) que satisfacen:

0
0
f (x , u ) =

0

0
652 13 Control de un pendulo de Furuta

es decir, de acuerdo a (13.11), (13.10):

x2 = 0 = 0, x4 = 1 = 0,

w1 (x1 , 0, x3 , 0, u )
= M 1 (x1 , x3 )
w2 (x1 , 0, x3 , 0, u )

0 u
C(x1 , 0, x3 , 0) g(x1 , x3 ) +
0 0

0
=
0

Del segundo renglon de estas condiciones se obtiene:



u 0
= g(x1 , x3 ) =
0 m1 l1 g sin(1 )

es decir:

u = 0, x3 = 1 = n

donde n puede ser cero o cualquier numero entero. Notese que no existe nin-
guna condicion que deba cumplir x1 = 0 lo cual significa que esta variable
puede elegirse de manera totalmente arbitraria. Debido a que se desea esta-
bilizar (o equilibrar) el pendulo en su posicion vertical invertida (n = 0) se
selecciona el siguiente punto de operacion:

x1 0
x2 0
x =

x3 = 0 , u = 0 (13.12)
x4 0

De acuerdo a (7.29), (7.30), (7.31) el modelo no lineal dado en (13.10), (13.11)


puede ser aproximado por el siguiente modelo lineal:

z = Az + Bv (13.13)
f1 (x,u) f1 (x,u) f1 (x,u) f1 (x,u)
x1 x2 x3 x4
f2 (x,u) f2 (x,u) f2 (x,u) f2 (x,u)
x1 x2 x3 x4
A= f3 (x,u) f3 (x,u) f3 (x,u) f3 (x,u)
x1 x2 x3 x4

f4 (x,u) f4 (x,u) f4 (x,u) f4 (x,u)
x1 x2 x3 x4 x=x ,u=u
f
1 (x,u)

f2u
(x,u)

B = f3u
(x,u)
u
f4 (x,u)
u x=x ,u=u

donde z = x x y v = u u . El uso de (13.9), (13.10), (13.11), (13.12),


(13.13) define un procedimiento matematico (que a pesar de ser un poco largo
13.3 Construccion del pendulo de Furuta 653

solo involucra operaciones matematicas sencillas) al final del cual se obtiene


lo siguiente:

0 1 0 0 0
0 gm21 l12 L0 J1 +m1 l12
0 I0 (J1 +m1 l12 )+J1 m1 L20
0

2 2


A= , B = I0 (J1 +m1 l1 )+J1 m1 L0 (13.14)
0 0 0 1 0
(I0 +m1 L20 )m1 l1 g m1 l1 L0
0 0 I0 (J1 +m1 l12 )+J1 m1 L20
0 I0 (J1 +m1 l12 )+J1 m1 L20

La expresion (13.13) junto con (13.14) constituyen el modelo lineal aproxi-


mado que se buscaba. Como se menciono anteriormente, usando (13.13) y
(13.14) se puede disenar un controlador por realimentacion lineal del estado
el cual, sin embargo, asegura buenos resultados si se restringe que el estado
y la entrada solo evolucionen alrededor del punto de operacion (13.12). Esto
tambien suele indicarse diciendo que z 0 y v 0. Esto significa que una
tarea que jamas podra resolver el controlador que se disena en este captulo
es el llevar el pendulo desde su posicion vertical hacia abajo (1 = [rad])
hasta su posicion vertical invertida (1 = 0). Si el lector esta interesado en
resolver dicho problema, se recomienda que consulte las referencias [2] y [3].

13.3. Construccion del pendulo de Furuta e


indentificacion de sus parametros
En la figura 13.3 se presenta un dibujo detallado que muestra las partes
mecanicas utilizadas para construir el pendulo de Furuta. Algunas de estas
partes se introducen con el fin de acoplar mecanicamente el motor con el
brazo y este con el pendulo. Ademas, se acoplan dos potenciometros, uno
directamente a la flecha del motor (P2 ) y otro entre el brazo y el pendulo
(P1 ), para medir 0 y 1 , respectivamente. Todas estas partes tienen masas e
inercias que deben ser consideradas dentro del modelo del pendulo de Furuta.
Para calcular los momentos de inercia del sistema se recurre a expresiones
bien conocidas en los libros de texto sobre mecanica clasica para el momento
de inercia de determinados cuerpos geometricos tales como varillas, cilindros
y prismas rectangulares. Debe tenerse presente que la manera que a conti-
nuacion se describe para calcular los parametos del pendulo de Furuta puede
admitir algunas variantes. De hecho, estos parametros deben ser considerados
como meras aproximaciones cuya exactitud se ve respaldada por el hecho de
que los valores obtenidos permiten calcular, mas adelante, las ganancias del
controlador que, en efecto, permiten resolver el problema de control que in-
teresa, es decir, estabilizar o equilibrar el pendulo en su posicion vertical
invertida.
Para calcular la inercia I0 se suma la inercia Ibrazo de la varilla que forma
al brazo, la inercia Icubo del prisma rectangular C1 (usado para acoplar la
flecha del motor al brazo) y la inercia del motor Irotor . Los valores numericos
654 13 Control de un pendulo de Furuta

de estas inercias se calculan como se indica a continuacion. Se mide la longitud


total del brazo, L0 = 0.235[m], desde el centro del potenciometro P1 hasta el
centro del prisma rectangular C1 , es decir, hasta la flecha del motor. La masa
total del brazo mbrazo es la suma de i) la masa de la varilla que forma al brazo,
m0 , ii) la masa de la abrazadera ab1 (que une el brazo con el potenciometro
P1 el cual representa el acoplamiento mecanico entre el brazo y el pendulo
pues el pendulo se une firmemente a la otra parte movil del potenciometro
P1 ) e iii) la mitad de la masa del potenciometro P1 . El momento de inercia de
una varilla que gira respecto de un eje perpendicular a la misma y que pasa
por uno de sus extremos se calcula por medio de la expresion [4]:
1 2
Ibrazo = mbrazo L20 = 0.96644 103 [kgm ]
3
Para calcular la inercia Icubo del prisma rectangular C1 se utiliza la siguiente
expresion que relaciona su momento de inercia con respecto a un eje de giro
que pasa por su centro [4], [5], pag. 271:
mcubo 2 2
Icubo = (b + c2 ) = 1.9333 106 [kgm ]
12
donde b y c son las longitudes de los lados de la cara superior del prisma C1
mientras que mcubo es su masa. Por ultimo se calcula la inercia del rotor del
motor. La masa del rotor, mr , se estima como la mitad de la masa del motor
completo mas la masa de la abrazadera ab2 (la cual une al potenciometro P2
con la flecha del rotor) mas la mitad de la masa del potenciometro P2 . La otra
mitad de la masa de P2 permanece siempre en reposo pues esta fija al soporte
del mecanismo. Como el motor es cilndrico, se supone que el rotor tambien
lo es y se estima su radio, R, como la mitad del radio de la carcasa del motor.
Esto permite estimar la inercia del rotor, sin necesidad de desarmar el motor,
del siguiente modo: la inercia de un cuerpo cilndrico de radio R y masa mr
que gira respecto a su eje longitudinal esta dada como [4], [5], pag. 271:
1 2
Irotor = mr R2 = 0.16931 103 [kgm ]
2
Por tanto, el momento de inercia I0 es:
2
I0 = Ibrazo + Icubo + Irotor = 1.137 103 [kgm ]

Para calcular el momento de inercia J1 del pendulo se considera que su ma-


sa m1 esta formada por la suma de 1) la masa del pendulo, 2) la masa del
acoplamiento entre el pendulo y el potenciometro P1 (placa rectangular de
aluminio que se observa en la figura 13.3) y 3) la mitad de la masa del poten-
ciometro P1 . Esto debido a que la otra mitad de la masa del potenciometro
P1 pertenece a la masa total del brazo. Para calcular el momento de inercia
de una varilla que gira sobre un eje perpendicular a la misma y que pasa a
traves de su centro de masa se utiliza la expresion [4], [5], pag. 271:
13.3 Construccion del pendulo de Furuta 655

1 2
J1 = m1 (2l1 )2 = 0.38672 103 [kgm ]
12
donde l1 = 0.1875[m] es la distancia desde el centro del potenciometro P1
hasta el centro de gravedad del pendulo (ubicado en el centro del pendulo) y
la masa del pendulo es m1 = 0.033[kg].
El modelo (13.13), (13.14) supone que la senal de control v = u (porque
u = 0) es un par. Sin embargo, en la practica la senal de control es un voltaje
que se aplica al motor el cual se encarga de generar el par u. Para resolver
este problema se procede del siguiente modo. Suponga que en el modelo (9.9),
(9.10) de la seccion 9.1 la dinamica electrica es muy rapida, es decir, que L = 0
y ke = 0. Entonces se encuentra que el par generado por el motor esta dado
aproximadamente por:
km
=u= Ea (13.15)
ra
donde ra es la resistencia de armadura del motor, Ea es el voltaje aplicado en
sus terminales y km es la constante de par del motor. Con el fin de poder usar
el voltaje de armadura como senal de control se debe determinar el valor de la
constante km /ra . Esto se consigue mediante el siguiente experimento. El eje
del motor se coloca en posicion horizontal con el brazo y el pendulo montados
en sus posiciones. Se aplica cuidadosamente un voltaje en las terminales de
la armadura, de manera que se consiga el equilibrio (reposo) cuando el brazo
quede colocado horizontalmente (el pendulo queda colocado verticalmente).
Esto significa que se ha conseguido un equilibrio entre el par generado por
el motor y el par producido, sobre el eje del rotor, por el peso del brazo y
el peso del pendulo. Una vez conseguido esto se mide el voltaje aplicado a
la armadura Ea y se calcula el par debido al peso del brazo y al peso del
pendulo. Con estos datos se usa (13.15) para calcular la constante:

km
= 0.0215[Nm/V]
ra
Finalmente, usando (13.13), (13.14), (13.15) y = v junto con los valores
numericos calculados en esta seccion se encuentra el siguiente modelo el cual
sera usado para disenar el controlador:

z = Az + BEa (13.16)

01 0 0 0
0 0 35.81 0 km 13.4684
A= 0 0
, B=B =
0 1 ra 0
0 0 72.90 0 12.6603

Notese que el voltaje de armadura Ea es ahora la senal de control y que, de


acuerdo a (13.15), el valor de esta variable en el punto de operacion dado en
(13.12) es Ea = 0 .
656 13 Control de un pendulo de Furuta

Figura 13.3. Componentes del pendulo de Furuta construido.

13.4. Diseno del controlador


A continuacion se disena un controlador por realimentacion lineal del es-
tado que permita estabilizar al sistema dado en (13.16) en z = 0, es decir en
x = x con x dado en (13.12). El controlador debe tener la siguiente forma:

Ea = Kz (13.17)

T
K = k1 k2 k3 k4 , z = x x = 0 0 1 1

donde k1 , k2 , k3 y k4 son cuatro ganancias constantes que deben determinarse


de manera que se asegure que z tiende a cero (que x tiende a x ) conforme el
tiempo crece. El calculo de estas ganancias constituye el diseno del controla-
dor. Notese que el uso de (13.17) en (13.16) permite escribir:

z = (A BK)z

De acuerdo a lo expuesto en la seccion 7.5 si todos los eigenvalores de la


matriz:

A BK (13.18)

tienen parte real estrictamente negativa entonces se asegura que z tiende a


cero conforme el tiempo crece o, equivalentemente, que ambas 0 y 1 tienden
a cero conforme el tiempo crece, lo cual significa que se consigue estabilizar o
equilibrar al pendulo de Furuta en su posicion vertical invertida. El primer
13.5 Construccion del controlador 657

paso para disenar el controlador (13.17) consiste en verificar la controlabilidad


de la planta dada en (13.16). De acuerdo a lo expuesto en la seccion 7.9, esto
se cumple si la siguiente matriz de 4 4 tiene rango 4:

B AB A2 B A3 B

Esto es verificado facilmente calculando numericamente el determinante que


resulta ser diferente de cero. Se concluye entonces que (13.16) es controla-
ble. Esta propiedad asegura que siempre es posible encontrar un vector de
ganancias K (definido en (13.17)) que consigue asignar a los eigenvalores de
la matriz en (13.18) cualquier valor que se desee. Como se menciono anterior-
mente, la seleccion obvia y deseable es que todos estos eigenvalores tengan
parte real negativa.
En base a lo anterior, el diseno del controlador se realiza del siguiente
modo. Se propone el siguiente conjunto de eigenvalores para la matriz en
(13.18):

1 = 94, 2 = 18, 3 = 0.5, 4 = 1

Usando el procedimiento presentado en los ejemplos 7.6 y 7.7 del captulo 7


se encuentra que el correspondiente vector de ganancias es:

K = 1.5215 4.6690 152.0048 13.8931 (13.19)

Esto significa que el controlador en (13.17) se escribe finalmente como:

Ea = 1.52150 + 4.66900 + 152.00481 + 13.89311 (13.20)

Es importante decir que aunque existen muchos vectores de ganancias K que


desde el punto de vista teorico resuelven el problema de control, sin embargo,
desde el punto de vista practico, no todas las ganancias K as calculadas per-
miten obtener resultados experimentales satisfactorios. As que las ganancias
en (13.19) fueron seleccionadas despues de verificar experimentalmente que
producen buenos resultados.

13.5. Construccion del controlador


El controlador (13.20) se construye usando el microcontrolador PIC16F877
A de Microchip. A continuacion se explica como se ha hecho esto. Antes que
nada se debe aclarar que no es el proposito presentar toda una exposicion de
como trabaja este microcontrolador. Lo que se presenta es una descripcion de
los recursos de este microcontrolador que se utilizan para construir el contro-
lador (13.20). Al final de este captulo se presenta un listado del programa
utilizado. El microcontrolador PIC16F877A [6] es de tecnologa EEPROM,
tiene una velocidad de operacion maxima de 20[MHz]. Cuenta con 5 puertos
de entrada-salida configurables, 3 temporizadores (el timer TMR0 es utilizado
658 13 Control de un pendulo de Furuta

en este captulo para establecer el periodo de muestreo: T = 0.0256[seg]), 8 ca-


nales Analogico-Digital los cuales se basan en un CAD (convertidor Analogico-
Digital) de 10 bits (de los cuales solo se usan los 8 bits mas significativos en
este captulo). Tambien cuenta con 2 modulos PWM de los cuales en este
captulo se usa el CCP1 para entregar el voltaje de control a la planta. Es-
te PWM se programa para trabajar a una frecuencia de 4.9[KHz] con una
resolucion de 28 1 = 255 cuentas.
Las posiciones 0 y 1 se miden usando los potenciometros de precision
de una vuelta P2 y P1 , respectivamente (ver figura 13.3). Las variaciones de
voltaje de estos potenciometros son ledas usando los canales 0 y 1 del CAD,
respectivamente. Se considera que una vuelta completa de cada potenciometro
equivale exactamente a 2 radianes y que el rango del CAD (solo se usan los 8
bits mas significativos) equivale a tal variacion angular. Mas aun, el centro de
las variaciones de cada potenciometro es la posicion correspondiente al punto
de operacion dado en (13.12), es decir x1 = 0 = 0 y x3 = 1 = 0. Con esto
en mente se hacen las siguientes operaciones:
2
theta0 = (CAD0 127) (13.21)
255
2
theta1 = (CAD1 127) (13.22)
255
donde CAD0 y CAD1 representan las lecturas entregadas por los canales 0
y 1 del CAD, respectivamente, mientras que theta0 y theta1 representan las
mediciones de 0 y 1 , respectivamente, en radianes. Las velocidades 0 y 1
se estiman a partir de las posiciones medidas usando diferenciacion numerica:

theta0 (k) theta0 (k 1)


dtheta0 = (13.23)
T
theta1 (k) theta1 (k 1)
dtheta1 = (13.24)
T
donde k representa el tiempo discreto, dtheta0 y dtheta1 representan los es-
timados de las velocidades 0 y 1 , respectivamente, en radianes por segundo
mientras que T = 0.0256[seg] es el periodo de muestreo utilizado. De este mo-
do theta0 (k) indica el valor de theta0 que se mide en el instante de muestreo
actual y theta0 (k 1) indica el valor de theta0 que se midio en el instante de
muestreo previo. theta1 (k) y theta1 (k 1) se definen de manera similar. Con
esta informacion se calcula:

da = 1.5215 theta0 + 4.6690 dtheta0 + 152.0048 theta1 + 13.8931 dtheta1

y se enva da al PWM del microcontrolador como se describe a continuacion.


Se supone que da solo tomara valores en el rango de -5 a +5 volts, por lo
que su valor se satura por software para restringirlo a ese rango de valores
utilizando instrucciones como las siguientes:
13.5 Construccion del controlador 659

if da > 5 then da = 5
if da < 5 then da = 5

Como la resolucion del PWM es de 28 1 = 255 cuentas, entonces la si-


guiente cuenta debe ser enviada al PWM del microcontrolador para entregar
correctamente el valor de da al amplificador de potencia de la planta:
255
cuenta = abs(da ) (13.25)
5
donde abs(da ) representa el valor absoluto de da . El signo de da es almacenado
en dos bits de control. La senal del PWM se entrega a un puente H (L293D
de Texas Instruments) que se encarga de amplificar convenientemente la po-
tencia de la senal del PWM. Este puente H esta alimentado con una fuente de
potencia de 7[V]. Sin embargo, de acuerdo a la hoja de datos de este disposi-
tivo [7] las caidas de voltaje en el mismo determinan que en las terminales del
motor solo sean aplicados 5[V]. Este dispositivo tiene dos bits a traves de
los cuales se le indica el signo del voltaje que debe entregar. Para ello, el signo
de da se enva al puente H a traves de los bits 0 y 1 del canal D. Esto significa
que el voltaje promedio que el puente H entrega a las terminales del motor
solo vara en el rango de -5 a +5 volts. As, se asegura que en las termina-
les del motor de CD se aplica un voltaje Ea cuyo promedio es numericamente
igual a da . Esto es importante porque asegura que la construccion practica del
controlador respeta el diseno indicado en (13.20). En la figura 13.4 se muestra
el diagrama electrico usado para construir el controlador (13.20) en base al
microcontrolador PIC16F877A. Resulta interesante observar la sencillez del
hardware utilizado.
660 13 Control de un pendulo de Furuta

Figura 13.4. Diagrama electrico del sistema de control del pendulo de Furuta.
13.6 Resultados experimentales 661

13.6. Resultados experimentales


En la figura 13.5 se muestran los resultados experimentales obtenidos.
Notese que aunque la posicion del brazo 0 no consigue estabilizarse en cero,
sin embargo la posicion del pendulo 1 permanece en cero, es decir, en la
configuracion vertical invertida. Notese tambien la presencia importante de
ruido, el cual es debido a los potenciometros usados para medir la posicion
del brazo y del pendulo. Es importante subrayar que, a pesar de esto, los
resultados experimentales muestran que se ha conseguido el principal objetivo
de control: mantener el pendulo equilibrado alrededor de su posicion vertical
invertida. En la figura 13.6 se muestra una fotografa donde se observa el
sistema de control funcionando.

1
[rad]

0
[rad]

tiempo [s]

Figura 13.5. Resultados experimentales.


662 13 Control de un pendulo de Furuta

Figura 13.6. El sistema de control completo funcionando.

Programacion del microcontrolador PIC16F877A

Se recomienda consultar la referencia [8] para una explicacion precisa de


cada una de las instrucciones que aparecen en el siguiente listado.

/*PROGRAMA PARA EL COMPILADOR DE C PCWH VERSION 3.203*/

/*PROGRAMA PARA CONTROLAR UN PENDULO DE FURUTA EN LA POSICION


VERTICAL INESTABLE CON UN MICROCONTROLADOR (PIC16F877A) Y UN
PUENTE H (L293D) MEDIANTE UNA RETROALIMENTACION DE ESTADO (u=-K*x)
*/ #include<16F877A.h> #include <stdlib.h> #include <math.h>

#fuses HS,NOWDT,PUT,NOBROWNOUT,NOLVP,NOWRT,NOPROTECT,NOCPD

#use delay(clock=20000000) //Frecuencia del cristal Hz


/*Direcciones de los registros a utilizar*/
#byte TMR0 = 0x01
#byte OPTION= 0x81
#byte TRISA = 0x85
#byte TRISB = 0x86

#byte TRISC = 0x87


#byte TRISD = 0x88
#byte ADCON0= 0x1F

#byte ADCON1= 0x9F


#byte PORTB = 0x06
13.6 Resultados experimentales 663

/*Direcciones de los pines a utilizar*/

#bit RC2 = 0x07.2//Pin para mandar senal PWM al puente H (L293D)


#bit RD0 = 0x08.0//Pin para pilotear sentido de movimiento

#bit RD1 = 0x08.1//Pin para pilotear sentido de movimiento


/*RUTINA PRINCIPAL*/
void main(void)
{

/*DECLARACION DE VARIABLES LOCALES*/

unsigned int i,t_0,t_1,pwm;

float teta_0,teta_0_1,teta_0p,teta_1,teta_1_1,teta_1p,u;

/*Configuracion de la tasa de conteo del timer 0*/

OPTION=0x87;//pull ups deshabilitados, prescaler 1:256 para TMR0


/*Configuracion PWM*/

setup_ccp1(CCP_PWM);
//configurando ccp1 como PWM

setup_timer_2(T2_DIV_BY_4,255,1);
//configurandotimer2,(1/20000000)*4*4*256=2048us

/*Configuracion de entradas y salidas de los puertos*/

TRISA=0x0F;//configurando parte alta del puerto A como salidas y


//parte baja como entradas
TRISB=0x00;//configurando puerto B como
//salidas
TRISC=0x00;//configurando puerto C como salidas
TRISD=0x00;//configurando puerto D como salidas

/*Configuracion ADC*/
ADCON1=0x04;
ADCON0=0x81;

/*Inicializando variables*/
TMR0=0;
teta_0=0;
teta_1=0;
while(1)
{
teta_0_1=teta_0; //posicion anterior brazo
teta_1_1=teta_1; //posicion anterior Pendulo
664 13 Control de un pendulo de Furuta

ADCON0=0x81; //Cambiando a CH0


for(i=0;i<37;i++); //estabilizar capacitor interno
t_0=read_adc(); //leer ADC
teta_0=t_0-127.0; //compensando offset potenciometro
teta_0=0.02464*teta_0; //convirtiendo a radianes

ADCON0=0x89; //cambiando a CH1


for(i=0;i<37;i++); //estabilizar capacitor interno
t_1=read_adc(); //leer ADC
teta_1=t_1-127.0; //compensando offset potenciometro
teta_1=0.02464*teta_1; //convirtiendo a radianes
/*Calculo de derivadas*/
teta_0p=(teta_0-teta_0_1)/0.0256;
teta_1p=(teta_1-teta_1_1)/0.0256;
/*Calculando el control u=-K*x*/

u=1.5215*teta_0+4.6690*teta_0p+152.0048*teta_1+13.8931*teta_1p;
u=51.0*u; //escalamiento a volts de salida
/*Control de saturacion de la senal de control para el PWM*/
if(u>254.0)
u=255.0;
if(u<-254.0)
u=-255.0;
/*Piloteando sentido de movimiento del motor (pines al puente H)*/
if(u<0)
{
RD0=1;
RD1=0;
}
else
{
RD0=0;
RD1=1;
}
pwm=(unsigned int)abs(u);
PORTB=pwm; //valor del pwm por el puerto B
set_pwm1_duty(pwm); //actualizando el valor del PWM
/*Ajuste del periodo de control Ts=0.0256 seg*/
while(TMR0<250); //1 cuenta=0.0000512 seg,(0.0128seg)
TMR0=0;
while(TMR0<250); //1 cuenta=0.0000512 seg,(0.0128seg)
TMR0=0;
}
}
13.8 Preguntas de repaso 665

13.7. Resumen del captulo


En este captulo se ha construido un pendulo de Furuta y todas las interfa-
ces necesarias para su control en lazo cerrado. El esquema de control utilizado
es conocido como realimentacion lineal del estado. Consiste en la medicion de
las posiciones y las velocidades de los dos cuerpos que componen al mecanismo
y, multiplicandolas por constantes, sumarlas para obtener el par que debe ser
generado por el motor de CD usado como actuador. Dado que se trata de un
sistema inestable y no lineal, la solucion de este problema de control, as como
la construccion experimental del mismo, es de gran interes. Otra caracterstica
importante del presente captulo es el hecho de mostrar una manera diferen-
te de modelar sistemas mecanicos usando las ecuaciones de Euler-Lagrange.
Este enfoque es particularmente util cuando se modelan sistemas mecanicos
compuestos por varios cuerpos que se mueven independientemente (grados de
libertad).
De particular interes resulta la identificacion del valor numerico de los
parametros del prototipo. En la literatura de control se habla de masas, cen-
tros de masa e inercias sin entrar en mas detalles. Sin embargo, en la practica,
los cuerpos que componen al mecanismo a su vez estan compuestos por torni-
llos, acoplamientos, piezas con diferentes formas geometricas y masas, varillas,
etc. Esto significa que se debe encontrar la masa, el centro de masa y la inercia
equivalente de todas esas piezas que conforman a cada cuerpo del mecanismo.
En el presente captulo se ha mostrado una forma de hacer esto utilizando
formulas de la mecanica clasica. Tambien se ha mostrado la manera de obte-
ner un modelo lineal, que representa una aproximacion del modelo no lineal
mas exacto, el cual se emplea para disenar el controlador. Esto resulta en un
sistema de control que solo funcionara correctamente si la configuracion inicial
del mecanismo es cercana a la que se desea.

13.8. Preguntas de repaso


1. Por que se dice que el pendulo de Furuta es inestable en lazo abierto?
2. De una explicacion descriptiva (no analtica) de porque se necesita con-
trolar simultaneamente la posicion del brazo y la posicion del pendulo.
3. Describa el procedimiento para identificar los diferentes parametros del
mecanismo completo.
4. Como se identifican los parametros del motor?
5. Describa el funcionamiento del amplificador de potencia utilizado.
6. Explique que representan todos los posibles puntos de operacion del
pendulo de Furuta.
7. Por que la energa potencial del mecanismo solo considera la energa
potencial del pendulo?
8. Que representa la aproximacion lineal de un modelo no lineal?
666 13 Control de un pendulo de Furuta

9. Cual es la condicion que debe cumplir el controlador por realimentacion


lineal del estado para que el pendulo de Furuta funcione adecuadamente?
10. Por que es importante que el modelo del pendulo de Furuta sea contro-
lable? Que se puede hacer si no es controlable?
Referencias

1. H. Goldstein, C. Poole and J. Safko, Cassical Mechanics, Captulo 1, 3rd edition,


Addison Wesley, New York, 2000.
2. I. Fantoni and R. Lozano, Non-linear control for underactuated mechanichal
systems, Springer, London, 2002.
3. H.I. Torres Rodrguez, Control de sistemas no linealizables en forma exacta, Te-
sis de Mestra en Ciencias, CINVESTAV, Departamento de Ingeniera Electica,
Mexico D. F., 2002.
4. R. C. Hibbeler, Mecanica vectorial para ingenieros. Dinamica, (10a. edicion),
Pearson Educacion, Mexico, 2004.
5. M. Alonso and E.J. Finn, Fsica, Addison-Wesley Iberoamericana, Wilmington,
Delaware, 1995.
6. PIC16F877A Enhanced Flash Microcontroller, Data sheet, Microchip Techno-
logy Inc., 2003.
7. L293D Qudruple half-H drivers, Data sheet, Texas Instruments, 2004.
8. Custom Computer Services Incorporated, CCS C Compiler Reference Manual,
2003.
14
Control de un pendulo con rueda inercial

El pendulo de con rueda inercial es un mecanismo en el que se debe con-


trolar simultaneamente la posicion del pendulo y la velocidad de la rueda. Por
esta razon, es natural analizarlo y disenarle un controlador usando la tecnica
de las variables de estado. Por otro lado, este mecanismo es, de los prototipos
didacticos subactuados y no lineales, el mas sencillo. Por ello, es ideal para
introducir al lector en los conceptos de control de sistemas no lineales. Esta
es la principal razon para incluir el problema de controlar este mecanismo.
670 14 Control de un pendulo con rueda inercial

Objetivos del captulo

Modelar el pendulo con rueda inercial usando las ecuaciones de Euler-


Lagrange.
Disenar un controlador que levante el pendulo con rueda inercial de su
posicion vertical no invertida a su posicion vertical invertida.
Disenar un controlador que atrape el pendulo con rueda inercial en su
posicion vertical invertida.
Construir un pendulo con rueda inercial.
Identificar los parametros del pendulo con rueda inercial.
Construir los controladores para levantar y atrapar el pendulo con rueda
inercial.
Obtener resultados experimentales en el pendulo con rueda inercial cons-
truido.

14.1. Pendulo con rueda inercial

En este captulo se disena una estrategia de control para un mecanismo


conocido como el pendulo con rueda inercial (IWP). En la figura 14.1 puede
apreciarse el Pendulo con rueda inercial en la posicion vertical no invertida,
mientras que en la figura 14.2 se muestra un esquema de este mecanismo. Se
trata de un pendulo que en su extremo tiene fijo un motor de CD el cual
mueve a una rueda. En el punto de donde se suspende el pendulo no se aplica
ningun par externo. Se dice entonces que este punto no esta actuado mientras
que la rueda esta actuada porque recibe el par generado por el motor de CD.
Como el pendulo y la rueda definen dos grados de libertad [1] y solo existe un
actuador (en la rueda) se dice que este mecanismo es un sistema subactuado
[2].
El pendulo con rueda inercial (IWP) fue presentado por Spong et al. [2],
el cual ademas de usarse comunmente con fines academicos ha tenido fuertes
aplicaciones en la investigacion como prototipo de referencia para la prueba
de algoritmos no lineales de control [2]-[11].
La nomenclatura utilizada es la siguiente:
q1 es la posicion angular del pendulo.
q2 es la posicion angular de la rueda.
m1 es la masa del pendulo.
m2 es la masa de la rueda.
es el par aplicado a la rueda.
lc1 es la distancia al centro de masa del pendulo.
l1 es la longitud del pendulo.
I1 es la inercia del pendulo cuando gira alrededor de su centro de masa.
I2 es la inercia de la rueda (mas la inercia del rotor del motor de CD).
g es la aceleracion de la gravedad.
14.1 Pendulo con rueda inercial 671

Figura 14.1. Pendulo con rueda inercial en posicion vertical no invertida.

Figura 14.2. El pendulo con rueda inercial.

R es la resistencia de armadura del motor de CD.


L es la inductancia de armadura del motor de CD.
kb y km son las constantes de fuerza contraelectromotriz y de par, respec-
tivamente, del motor de CD.
u e i representan, respectivamente, el voltaje en las terminales de armadura
y la corriente electrica a traves de la armadura del motor de CD.
De acuerdo a la descripcion previa del pendulo con rueda inercial, es claro
que no es posible aplicar un par suficientemente grande como para llevar
al pendulo, de un solo golpe, desde la configuracion en la que q1 = 0 y su
672 14 Control de un pendulo con rueda inercial

velocidad es cero q1 = 0 hasta la configuracion en la que q1 = + o q1 =


y q1 = 0. Mas aun, esta ultima configuracion es inestable y se le denomina la
configuracion invertida inestable. Por estas razones resulta de mucho interes
disenar una estrategia de control: i) que lleve al pendulo desde los alrededores
de la configuracion q1 = 0 y q1 = 0 hasta la configuracion invertida inestable
e ii) que lo mantenga ah. A la primera parte de esta tarea se le denomina
levantar el pendulo y la segunda parte se denomina balancear el pendulo
o atrapar el pendulo.
Como se muestra en este captulo, la tarea de levantar el pendulo requiere
de tecnicas de control no lineal pues las tecnicas de control lineal no tienen
la capacidad para resolver este problema ya que el modelo del pendulo con
rueda inercial es no lineal. Sin embargo, aunque no lineal, el modelo de este
mecanismo es suficientemente sencillo de modo que esta estrategia puede ser
disenada usando ideas conceptuales sencillas. Por tanto, el objetivo de presen-
tar este problema de control en este captulo es introducir al lector, mediante
un ejemplo sencillo, a los metodos de diseno de control no lineal.

14.2. Modelo matematico

Dado que el pendulo es un mecanismo compuesto por dos cuerpos que


interactuan, su modelo matematico se obtiene utilizando las ecuaciones de
Euler-Lagrange, es decir:
d L L
=0 (14.1)
dt q1 q1
d L L
=
dt q2 q2
El cero en el lado derecho de la primera expresion indica que no hay ningun par
externo aplicado en el punto de donde se suspende el pendulo. El lagrangiano
esta dado como:

L = K P (14.2)
K = K1 + K2 , P = P1 + P2

donde K1 y K2 representan, respectivamente, las energas cineticas del pendu-


lo y de la rueda, mientras que P1 y P2 representan, respectivamente, las
energas potenciales del pendulo y de la rueda. Como el pendulo es un cuerpo
cuya masa esta distribuida a lo largo de una varilla, su energa cinetica se
calcula como la suma de la energa cinetica de una partcula de masa m1 que
se mueve sobre una circunferencia de radio lc1 mas la energa cinetica de una
varilla que gira alrededor de su centro de masa, es decir:
1 2 2 1
K1 = m1 lc1 q1 + I1 q12 (14.3)
2 2
14.2 Modelo matematico 673

La energa cinetica de la rueda se obtiene de manera similar. Sin embargo, se


debe tomar en cuenta que la velocidad con la que gira la rueda, medida por
un observador fijo en el laboratorio, es q1 + q2 . Entonces, se encuentra que:
1 1
K2 = m2 l12 q12 + I2 (q1 + q2 )2 (14.4)
2 2
Para calcular la energa potencial se utiliza como referencia (donde P1 y P2
son iguales a cero) la configuracion en la que q1 = 0. Recuerdese que la energa
potencial del pendulo es el producto de la fuerza aplicada sobre el pendulo
(peso del pendulo) y la distancia, en la direccion del peso, que separa al centro
de masa del pendulo en la posicion actual q1 respecto de la posicion en la que
la energa potencial es cero, es decir cuando q1 = 0. Entonces:

P1 = gm1 lc1 (1 cos(q1 )) (14.5)

Procediendo similarmente se encuentra la energa potencial de la rueda:

P2 = gm2 l1 (1 cos(q1 )) (14.6)

Por tanto, de acuerdo a (14.2):


1 2 2 1 1 1
L= m1 lc1 q1 + I1 q12 + m2 l12 q12 + I2 (q1 + q2 )2 gm(1 cos(q1 ))
2 2 2 2
donde m = m1 lc1 + m2 l1 . Sustituyendo L en las ecuaciones de Euler-Lagrange
presentadas en (14.1) y despues de agrupar convenientemente los terminos
resultantes se obtiene:

q mg sin (q1 ) 0
D 1 + = , (14.7)
q2 0
2

d d m1 lc1 + m2 l12 + I1 + I2 I2
D = 11 12 =
d21 d22 I2 I2

Es muy sencillo mostrar que el determinante de la matriz D es positivo, es


decir:

det(D) = d11 d22 d12 d21 > 0 (14.8)

El modelo en (14.7) es el modelo mas exacto del pendulo con rueda inercial y
en la siguiente seccion sera utilizado para disenar la estrategia de control que
lo levantara hasta su configuracion invertida inestable.
Finalmente, una aclaracion acerca de la senal de control utilizada. El vol-
taje aplicado al motor de CD que actua sobre la rueda es la senal que ver-
daderamente se puede manipular directamente, mientras que el par es una
variable que resulta como efecto de aplicar dicho voltaje. Sin embargo, en la
practica es posible suponer que el par es la senal de control si se considera
que la inductancia de armadura es muy pequena. La siguiente ecuacion es el
674 14 Control de un pendulo con rueda inercial

modelo matematico del circuito de armadura del motor de CD con escobillas


equipado con iman permanente que actua sobre la rueda:
di
L + Ri + kb q2 = u (14.9)
dt
Si L y kb se suponen iguales a cero, entonces:
km
= km i = u (14.10)
R
Esto significa que el voltaje aplicado tiene una accion directa sobre el par
generado y por eso es valido suponer que el par es la senal de control. El
hecho de suponer kb igual a cero se justifica del siguiente modo. Como pue-
de apreciarse en (14.9) este parametro introduce friccion viscosa adicional al
mecanismo. Como esto normalmente mejora la estabilidad de un sistema de
control, entonces suponer que kb = 0 solo hace mas interesante el problema
de control en el sentido de que el diseno se hara bajo la suposicion de que
ningun efecto estabilizante esta presente de manera natural en el mecanismo.

14.3. Controlador no lineal para levantar el pendulo


El objetivo en esta secccion es disenar un controlador que levante al pendu-
lo con rueda inercial hasta su configuracion invertida inestable, es decir, hasta
alguno de los puntos (q1 , q1 ) = (+, 0) o (q1 , q1 ) = (, 0). Mas adelante se
explicara por que no es importante el valor que tengan la posicion y la ve-
locidad de la rueda durante el intervalo de tiempo en el que se realiza esta
tarea.
Despejando q2 del primer renglon en (14.7), sustituyendo este valor en el
segundo renglon de (14.7) y usando (14.10) as como d12 = d22 se obtiene:

J q1 + mgl sin(q1 ) = 1 (14.11)


d22 d11 d21 d12 km
J= , mgl = mg, 1 = u
d12 R
Notese que J > 0 debido a (14.8). Por tanto, el modelo en (14.11) corresponde
a un pendulo simple donde J, m, l y g representan, respectivamente, su inercia,
su masa y su longitud equivalentes as como la aceleracion de la gravedad. La
energa de este pendulo se obtiene como la suma de su energa cinetica y
potencial, es decir:
1 2
V (q1 , q1 ) = J q + mgl(1 cos(q1 )) (14.12)
2 1
En la figura 14.3 se muestran las superficies de nivel de V . Esto significa
que cada curva en dicha figura representa el conjunto de puntos (q1 , q1 ) que
corresponden un valor constante de V (q1 , q1 ). El lector puede darse cuenta de
14.3 Controlador no lineal para levantar el pendulo 675

V > V0
V = V0 V = V0
0 < V < V0
q1
[rad=s]
V=0

q1 [rad]

Figura 14.3. Superficies de nivel de V en (14.12).

que las curvas mas externas corresponden a valores de V cada vez mayores
(positivos) y que la curva cerrada mas interna corresponde a un solo punto,
(q1 , q) = (0, 0), donde V tiene su valor mnimo e igual a cero.
Calculese la derivada respecto al tiempo de V (q1 , q1 ), dada en (14.12),
para encontrar:
dV (q1 , q1 )
= q1 J q1 + mglq1 sin(q1 ) (14.13)
dt
Si se sustituye el valor de J q1 obtenido a partir de (14.11) se obtiene:
dV (q1 , q1 )
= q1 1 (14.14)
dt
Lo que se acaba de calcular se conoce como la derivada de V a lo largo
de las trayectorias de (14.11) [12]. Esto quiere decir que (14.14) representa
d
los valores que toma dt V conforme el pendulo en (14.11) se mueve bajo el
efecto del par externo 1 . Por ejemplo, si 1 = 0 entonces, de (14.14) se
d
obtiene dt V = 0. Esto significa que conforme el pendulo se mueve su energa
V permanece constante. Esto provee mucha informacion como se explica a
continuacion. Conociendo el valor inicial de posicion y velocidad (q1 (0), q1 (0))
se puede saber el valor inicial de la energa V (q1 (0), q1 (0)). Como se sabe
676 14 Control de un pendulo con rueda inercial

d
que dt V = 0 porque 1 = 0 entonces, conforme el tiempo crece, el pendulo
debera moverse unicamente sobre los puntos que representan a la superficie de
nivel en la cual V (q1 (t), q1 (t)) = V (q1 (0), q1 (0)), las cuales se muestran en la
figura 14.3. Las flechas que se dibujan sobre las superficies de nivel representan
el sentido en el cual estas son recorridas conforme el pendulo se mueve. Estos
sentidos son faciles de determinar como se explica a continuacion. El estado
del pendulo simple se define como y = [q1 , q]T . La variable y = [q1 , q]T es un
vector cuya direccion indica hacia donde se esta moviendo el estado y. Notese
que la componente horizontal de y, es decir q1 , apunta hacia la derecha siempre
que la velocidad del pendulo q1 sea positiva. Esto es suficiente para determinar
el sentido de las flechas dibujadas sobre las superficies de nivel de V .
De acuerdo a lo expuesto en el parrafo anterior, para levantar al pendulo
hasta su configuracion invertida inestable solo se necesita conseguir que la
energa del pendulo alcance el valor:
1
V (q1 , q1 )|q o = J(0)2 + mgl(1 cos()) = 2mgl = V0
1 =+ q1 =
q1 =0
2

y si tal energa se alcanza en un punto donde (q1 , q1 ) 6= (+, 0) o (q1 , q1 ) 6=


d
(, 0) entonces aplicar un par 1 que asegure que dt V = 0 a partir de ese
instante. Notese que, de acuerdo a la figura 14.3, si V se mantiene constante
una vez que V = V0 entonces el pendulo se seguira moviendo hasta llegar a
uno de los puntos (q1 , q1 ) = (+, 0) o (q1 , q1 ) = (, 0). A continuacion se
muestra que todo este mecanismo se asegura si se usa:

1 = kd sat(q1 ) signo(V V0 ) (14.15)



0 , q1 > 0 +1, V > V0
sat(q1 ) = 0 , q1 < 0 , signo(V V0 ) = 1, V < V0 (14.16)

q1 , |q1 | 0 0, V = V0

donde 0 y kd son constantes positivas arbitrarias. Sustituyendo (14.15) en


(14.14):

dV (q1 , q1 )
= kd q1 sat(q1 ) signo(V V0 ) (14.17)
dt
A partir de (14.16) es facil darse cuenta de que el producto q1 sat(q1 ) siempre
es positivo y es cero solo cuando q1 = 0. As que mientras q1 6= 0 se cumple
lo siguiente:
d
Si V < V0 entonces dt V > 0, por lo que la energa V aumenta.
d
Si V > V0 entonces dt V < 0, por lo que la energa V disminuye.
d
Si V = V0 entonces dt V = 0, por lo que la energa V permanece en el
valor V0 .
Entonces, se asegura que la energa del pendulo V alcanza el valor necesario
para llegar a uno de los puntos (q1 , q1 ) = (+, 0) o (q1 , q1 ) = (, 0). Mas
14.3 Controlador no lineal para levantar el pendulo 677

aun, la energa se mantiene en ese valor hasta que uno de dichos puntos es
alcanzado. Lo unico que falta es analizar que sucede si q1 = 0. Notese que bajo
esa condicion el pendulo esta en reposo. Sin embargo, la unica manera de que
q1 = 0 se mantenga para siempre es que q1 = 0 porque solo ah el pendulo
puede permanecer en reposo. As que sera necesario aplicar al pendulo un
pequeno golpe para que abandone la configuracion (q1 , q1 ) = (0, 0).
Todo el analisis previo asegura que el pendulo alcanzara la configuracion
invertida inestable si, partiendo de la configuracion estable, se le aplica un
pequeno golpe que simplemente lo saque del reposo. El lector puede darse
cuenta que todo lo anterior se mantiene sin cambio si en el controlador (14.15)
se usa sat(V V0 ) en lugar de signo(V V0 ). Dicho sea de paso, el controlador
en (14.15), (14.16) tiene sus orgenes en las ideas propuestas en [13].
Por otro lado, es importante darse cuenta de que una vez alcanzada la
configuracion invertida inestable, el controlador (14.15) no asegura que el
pendulo vaya a permanecer en dicha configuracion. Para esto es necesario
disenar otro controlador, el cual debe ser puesto en marcha cuando el pendulo
este muy cerca de la configuracion invertida inestable. Esto significa que el
controlador en (14.15) debe ser desconectado a partir de ese momento. En la
siguiente seccion se presenta la manera de disenar el controlador que resuelve
la segunda parte del problema de control: balancear o atrapar el pendulo en
la configuracion invertida inestable.
Finalmente, notese que nada se ha dicho acerca de lo que sucede con la
posicion y la velocidad de la rueda durante el tiempo en el cual el pendulo
es llevado hasta su configuracion invertida inestable. Dado que la rueda es
simetrica y se supone que esta balanceada, entonces la posicion de la rueda
no importa. Por otro lado, aunque la velocidad de la rueda crece de manera
desconocida durante el tiempo mencionado, sin embargo el valor de esta ve-
locidad en el momento en que el pendulo llega a su configuracion invertida
inestable siempre es es finito y, por lo tanto, todo es cuestion de que el con-
trolador que atrapa al pendulo en dicha configuracion inestable se encargue
de regular la velocidad de la rueda en el valor que esta variable tiene en el
momento en que dicho controlador entra en operacion.
Ejemplo 14.1 Sea el controlador alternativo:
R
1 = kd (V V0 ) sat(q1 ), u = 1 (14.18)
km

d, q1 > d umax km
sat(q1 ) = d, q1 < d , d = (14.19)
kd RV0
q1 , |q1 | d

donde d, umax y kd son constantes positivas arbitrarias. Sustituyendo (14.18)


en (14.14):

dV (q1 , q1 )
= kd (V V0 ) q1 sat(q1 ) (14.20)
dt
678 14 Control de un pendulo con rueda inercial

A partir de (14.19) es facil darse cuenta de que el producto q1 sat(q1 ) siempre


es positivo y es cero solo cuando q1 = 0. As que mientras q1 6= 0 se cumple
de nuevo lo siguiente:
d
Si V < V0 entonces dt V > 0, por lo que la energa V aumenta.
d
Si V > V0 entonces dt V < 0, por lo que la energa V disminuye.
d
Si V = V0 entonces dt V = 0, por lo que la energa V permanece en el
valor V0 .
Entonces, se asegura nuevamente que la energa del pendulo V alcanza el
valor necesario para llegar a uno de los puntos (q1 , q1 ) = (+, 0) o (q1 , q1 ) =
(, 0).

14.4. Controlador para atrapar el pendulo


La estrategia que se utiliza para atrapar al pendulo en la configuracion
invertida inestable es un controlador lineal que es disenado usando un modelo
lineal aproximado de (14.7). A continuacion se muestra como obtener dicha
aproximacion lineal.
Notese que el modelo en (14.7) no depende de la posicion de la rueda q2 .
Tomando esto en consideracion se puede definir el estado como:

x1 q1
x = x2 = q1 , (14.21)
x3 q2

De (14.7) se puede escribir:



q1 1 mg sin (q1 ) 0
=D + (14.22)
q2 0

1 d11 d12 1 d22 d12
D = = (14.23)
d21 d22 d11 d22 d12 d21 d21 d11

Notese que det(D1 ) 6= 0 porque se trata de la inversa de una matriz no


singular. Usando (14.21) y (14.22) el modelo en (14.7) se puede escribir como:

x2
x = f (x, ) = d11 mg sin (x1 ) + d12 (14.24)
d21 mg sin (x1 ) + d22

De acuerdo a la seccion 7.2.2, los puntos de operacion (x , ) de (14.24) se


encuentran a partir de la condicion f (x , ) = 0, es decir:

x2 0
d11 mg sin (x1 ) + d12 = 0 . (14.25)
d21 mg sin (x1 ) + d22 0
14.4 Controlador para atrapar el pendulo 679

Es claro que:

x2 = 0 (14.26)

Por otro lado, del segundo y tercer renglones de (14.25) se obtiene:

d11 mg sin (x1 )


= (14.27)
d12
d21 mg sin (x1 )
=
d22
Igualando estas expresiones:
mg
d11 d22 d21 d12 sin (x1 ) = 0 (14.28)
d12 d22
Debido a que det(D1 ) = d11 d22 d21 d12 6= 0, entonces (14.28) solo se cumple
si:
x1 = n, n = 0, 1, 2, 3, . . . (14.29)
Sustituyendo esta condicion en cualquiera de las expresiones en (14.27) se
obtiene:
= 0 (14.30)
Finalmente, como no existe ninguna restriccion sobre x3 se concluye:

x3 = c. (14.31)

donde c es cualquier numero real. De acuerdo a la seccion 7.2.2, la aproxima-


cion lineal del sistema en (14.24) en el punto de operacion (14.26), (14.29),
(14.30), (14.31), con n = 1, esta dada como:

z = Az + Bw, (14.32)

f1 f1 f1 0 10
f (x, ) x1 x2 x3
f2 f2 f2
A= = = d11 mg 0 0 ,
x x x1
f3
x2
f3
x3
f3
x1 x2 x3
x d21 mg 0 0

f1
0
f (x, )
f2


B= = = d12
x

f3

x

d22

donde:

z = x x , (14.33)

w = . (14.34)

son cantidades pequenas, es decir z 0, w 0. Por otro lado, recuerdese que


= 0 y, por tanto, w = . entonces se puede usar (14.10) para encontrar la
siguiente version modificada de (14.32):
680 14 Control de un pendulo con rueda inercial

z = Az + Bu (14.35)

0
km
B = d12
R
d22

Este es el modelo lineal aproximado que sera utilizado para disenar el contro-
lador que atrapa o balancea al pendulo en su configuracion invertida inestable.
Primero se verifica si el par (A, B) es controlable. Para esto, se calcula el
determinante de la matriz de controlabilidad C = [B|AB|A2 B] y se encuentra
que esta dado como:
3
mgkm 2
det(C) = 3
d12 (d11 d22 d12 d21 ) 6= 0, (14.36)
R
Por tanto, se concluye que el par el par (A, B) es controlable. Esto significa
que siempre es posible encontrar un vector de ganancias K tal que todos los
eigenvalores de la matriz de lazo cerrado (A BK) queden ubicados en donde
se desee. Esto se consigue usando el controlador:

u = Kz (14.37)

El valor de K se calcula una vez que se conocen los valores numericos de los
parametros involucrados en las matrices A y B. Con el controlador (14.37) se
consigue atrapar el pendulo con rueda inercial en la configuracion invertida
inestable definida por el punto de operacion (14.26), (14.29), (14.30), (14.31),
con n = 1. Es importante subrayar que para esto es indispensable que el
estado x del mecanismo se encuentre suficientemente cerca de dicha configu-
racion inestable en el momento en que el controlador en (14.37) empiece a
operar.
Finalmente, es conveniente aclarar que la constante c introducida en
(14.31) toma el valor que la velocidad de la rueda tiene en el instante en
el cual el controlador (14.37) empieza operar. Como esta velocidad puede te-
ner cualquier valor, entonces es muy adecuado el hecho de que c pueda ser
cualquier constante real.

14.5. Construccion del pendulo con rueda inercial e


identificacion de sus parametros
En la figura 14.4 se presenta un dibujo detallado que muestra las partes
mecanicas utilizadas para construir el pendulo con rueda inercial. Algunas de
estas partes son introducidas con el fin de realizar el acoplamiento mecanico
entre las piezas que componen al mecanismo. Tambien se incluye un enco-
der incremental y un tacometro para medir, respectivamente, la posicion del
pendulo q1 y la velocidad de la rueda q2 . En la tabla 14.1 se muestran los
14.5 Construccion del pendulo con rueda inercial 681

Soporte
del mecanismo

Dado

Tornillos Encoder

Base
Solera
(pendulo)

Manguera
de boligrafo Motor CD

Rueda
Tacometro
Soporte del
tacometro
Figura 14.4. Partes que componen al pendulo con rueda inercial construido.

Tabla 14.1. Parametros simples.


Smbolo: Descripcion: Valor: Unidades:
l1 longitud de la solera 0.117 m
asol ancho de la solera 0.0254 m
msol masa de la solera 0.016 Kg
mcar masa de la carcasa del actuador 0.03 Kg
msop masa del soporte del tacometro 0.01375 Kg
mrot masa del rotor del actuador 0.02 Kg
rrot radio del rotor del actuador 0.00915 m
mrue masa de la rueda 0.038 Kg
rrue radio de la rueda 0.0189 m
R resistencia de armadura 4.172 Ohm
L inductancia de armadura 0.0009 H
kb constante de fuerza contra electromotriz 0.00775 Vs/rad
km constante de par 0.00775 Nm/A
682 14 Control de un pendulo con rueda inercial

parametros medidos de las piezas que componen al pendulo con rueda inercial
as como del motor de CD utilizado como actuador.
La masa equivalente del primer grado de libertad m1 se define como:

m1 = msol + mcar + msop = 0.05975 [Kg]. (14.38)

Para calcular el centro de masa del primer grado de libertad con todos sus
componentes, se aplica el principio de la balanza (la suma de pares en el punto
de apoyo debe de ser igual a cero), por tanto al aplicar un peso equivalente
a una distancia lc1 en el extremo opuesto de la solera, el arreglo de la figura
14.5 debe quedar balanceado. Usando (14.38) y los datos de la tabla 14.1 se
tiene que:
msol l21 + mcar l1 + msop l1
lc1 = = 0.10133 [m]. (14.39)
m1

Figura 14.5. Esquema para calcular lc1 .

El momento de inercia de una placa rectangular de masa m, ancho b y


largo d con eje de rotacion x colocado sobre una direccion perpendicular al
plano de lados b y d y que pasa por su centro esta dado como [14], [15], pag.
271:
1
Ix = m(b2 + d2 ) (14.40)
12
Usando (14.40) y los datos de la tabla 14.1 se obtiene el momento de inercia
I como:
1
I = msol (a2sol + l12 ) = 0.0000191122 [Kg m2 ] (14.41)
12
Sin embargo, el momento de inercia I1 esta definido alrededor de un eje que
pasa por el centro de masa del pendulo ubicado a una distancia lc1 l1 /2 del
centro de la cara de lados b y d. De acuerdo al teorema del eje paralelo o de
Steiner [14], [15], pag. 272:
2
l1
I1 = I + msol lc1 = 0.000048463 [Kg m2 ]
2

Por otro lado, el momento de inercia de un disco de masa m y radio r con


un eje de rotacion x colocado a traves de su centro y que es perpendicular al
disco esta dado como [14], [15], pag. 271:
14.5 Construccion del pendulo con rueda inercial 683

1 2
Ix = mr (14.42)
2
Con los datos de la tabla 14.1 y la expresion (14.42) se tiene que el momento
de inercia de la rueda Irue esta dado como:
1 2
Irue = mrue rrue = 0.000006787 [Kg m2 ] (14.43)
2
El momento de inercia de un cilindro de masa m, radio a y altura l con un
eje de rotacion x colocado a traves de su eje longitudinal esta dado como [14],
[15], pag. 271:
1
Ix = ma2 . (14.44)
2
Usando la expresion (14.44) y los datos de la tabla 14.1 se tiene que el momento
de inercia del rotor del actuador Irot esta dado como:
1 2
Irot = mrot rrot = 0.000000837225 [Kg m2 ] (14.45)
2
La masa equivalente del segundo grado de libertad m2 se define como:
m2 = mrot + mrue = 0.058 [Kg] (14.46)
Usando (14.43) y (14.45) se tiene que el momento de inercia del segundo grado
de libertad I2 esta dado como:
I2 = Irue + Irot = 0.0000076242 [Kg m2 ] (14.47)
Finalmente con los datos de la tabla 14.1, los parametros en (14.41), (14.38),
(14.39), (14.46), (14.47) y g = 9.81[m/s2 ], se tiene que los valores numericos
de los parametros del modelo (14.7) son:
d11 = 0.0014636, d12 = 0.0000076, (14.48)
d21 = 0.0000076, d22 = 0.0000076, (14.49)
mg = 0.12597 (14.50)
Es importante mencionar que la masa del tacometro se considera dentro de
la masa del soporte del tacometro, ademas de que el efecto del rotor del
tacometro se considera despreciable en el calculo de la inercia I2 . Esto debido
a que tiene una masa menor a los 0.0001[Kg] y un radio menor a los 0.001
[m]. Por otro lado, los tornillos de sujecion del dado, el dado (de plastico)
y el eje del encoder incremental se desprecian para el calculo de la inercia
I1 . Esto debido a que la suma de las masas de estos componentes es menor
a los 0.008[Kg] y, lo mas importante, estan directamente en el eje de giro
del pendulo por lo que los radios inerciales son muy pequenos y el efecto
inercial producido es despreciable. Finalmente, la masa de los dos alambres
conductores (tanto del actuador como del tacometro), as como la masa de
la manguera de bolgrafo (de plastico) usada para acoplar el tacometro a la
rueda, no fueron consideradas en el modelado del prototipo experimental.
684 14 Control de un pendulo con rueda inercial

Ejemplo 14.2 A continuacion se presenta la simulacion, usando SIMU-


LINK, del pendulo con rueda inercial con los controladores (14.18) y (14.37).
Primeramente se muestra el programa de matlab que se encarga de cargar los
valores numericos de las constantes que usara la simulacion:
clc,clear all;
% Constantes del Motor
R=4.172;
km=0.00775;
Umax=13;
% Modelo del IWP
g=9.81;
mgl=0.12597;
mbg=mgl
d11=0.0014636;
d12=0.0000076;
d21=d12;
d22=d21;
J= (d11*d22-d12*d21)/d12;
D=[d11 d12;d21 d22];
Di=inv(D);
di11=Di(1,1)
di12=Di(1,2)
di21=Di(2,1)
di22=Di(2,2)
%Matrices del IWP linealizado en el punto de operacion
A=[0 1 0;di11*mbg 0 0;di21*mbg 0 0]
B=[0;di12*km/R;di22*km/R]
%Determinar la Controlabilidad
disp(El sistema es controlable?); Pc=ctrb(A,B); if rank(Pc) ==
size(Pc)
disp(Si.);
else
disp(No.);
end
%Controlador No-Lineal
Kd=20;
V0=2*mbg
d=(Umax*km)/(R*Kd*V0)
%Control por retroalimentacion de estado en punto de operacion
n=1
c=-570
xd=[n*pi 0 c]
%valores propios deseados en lazo cerrado
lambda1= -9.27 + 20.6i;
lambda2= -9.27 - 20.6i;
lambda3= -0.719;
Vp=[lambda1 lambda2 lambda3]
K = place(A,B,Vp)
14.5 Construccion del pendulo con rueda inercial 685

%Verificar los valores propios de lazo cerrado


Vp_=eig(A-B*K)
Una vez que se ha ejecutado el programa anterior, ya es posible ejecutar
la simulacion. En la figura 14.6 se muestra el diagrama de SIMULINK con
las conexiones necesarias para simular el pendulo con rueda inercial con el
controlador no lineal (14.18) y con el controlador lineal (14.37).

Figura 14.6. Diagrama para simular el IWP en SIMULINK.

En la parte central de la figura 14.6 esta armado el pendulo con rueda


inercial partiendo de la ecuacion de estado no lineal (14.24) con = kRm u. En
la parte superior de la figura 14.6 esta armado el controlador no lineal (14.18),
mientras que en la parte inferior de la misma figura se encuentra armado el
controlador lineal (14.37). Para que la simulacion no se quede atascada en el
reposo de la posicion vertical no invertida, se le puso al segundo integrador
una condicion inicial de 0.00001[rad/s].
En la figura 14.7 se muestra la evolucion en el tiempo de cada uno de los
elementos del estado x, as como el voltaje u aplicado al motor del IWP.
Finalmente en la figura 14.8 se observa el valor de la energa deseada V0 ,
y la evolucion tanto de de la energa V como de la diferencia (V V0 ).
686 14 Control de un pendulo con rueda inercial

Figura 14.7. Visualizacion de la simulacion en osciloscopio 1.

Figura 14.8. Visualizacion de la simulacion en osciloscopio 2.


14.6 Construccion del controlador 687

14.6. Construccion del controlador


Usando los valores numericos de la seccion 14.5, considerando kd = 1 y
de acuerdo a (14.11), (14.15) se obtiene el controlador que levanta el pendulo
hasta su configuracion invertida inestable:
1
V = C1 q12 + mg(1 cos(q1 )), C1 = J, V0 = 2mg,
2
Rkd umax km
u = C2 sat(q1 ) signo(V V0 ), C2 = , 0 = , (14.51)
km kd R
donde umax = 13[V], mientras que las constantes C1 y C2 se calculan una sola
vez en la inicializacion del programa del controlador, para reducir el numero
de multiplicaciones necesarias en la implementacion.
Por otro lado, de acuerdo a las secciones 7.13.1 y 7.13.2, en el captulo
7, se encuentra que el uso del controlador lineal (14.37) junto con el vector
de ganancias K = [k1 , k2 , k3 ] = [340, 11, 0.0085] ubica los eigenvalores
de la matriz (A BK) en los siguientes valores: 1 = 5.8535 + 17.7192j,
2 = 5.8535 17.7192j y 3 = 0.5268. Por tanto, el controlador (14.37)
queda expresado como:

u = k1 (q1 q1d ) k2 q1 k3 (q2 q2d ) (14.52)

donde se usa cualquiera de los valores q1d = + o q1d = , dependiendo


de a cual valor se acerca primero q1 . Recuerdese que q2d = c es el valor que
tiene la velocidad de la rueda en el momento en que el controlador en (14.52)
empieza a operar.
Defnase la condicion:

(q1 q1d )2 + q12 < (14.53)

para alguna constante > 0 suficientemente pequena y q1d = + o q1d = .


Esta condicion significa que el pendulo se encuentra muy cerca de uno de los
puntos (q1 , q1 ) = (+, 0) o (q1 , q1 ) = (, 0). Esta cercana se puede ajustar
proponiendo (en esta implementacion se manejo = 0.3).
La estrategia de control para levantar y atrapar el pendulo con rueda
inercial consiste en utilizar (14.51) hasta que se cumpla (14.53) y a partir
de ese momento desconectar (14.51) y empezar a utilizar (14.52). Para rea-
lizar esta tarea se utiliza el microcontrolador PIC18F4431 de Microchip. A
continuacion se explica como se hace esto. Antes que nada se debe aclarar
que no es el proposito presentar toda una exposicion de como trabaja este
microcontrolador. Lo que se presenta es una descripcion de los recursos de
este microcontrolador que se utilizan para construir la estrategia de control
(14.51), (14.52), (14.53).
Al final de este captulo se presenta un listado del programa utilizado. El
microcontrolador PIC18F4431 [16] es de tecnologa flash, tiene una velocidad
de operacion maxima de 40 MHz (en este captulo se usa un cristal de 11
688 14 Control de un pendulo con rueda inercial

MHz ya que el circuito esta armado en tarjeta de pruebas). Cuenta con cinco
puertos de entrada-salida configurables, tres temporizadores de 16 bits y uno
de 8 bits (el temporizador de 8 bits es utilizado para establecer el periodo
de muestreo: Ts = 0.01 s), nueve canales Analogico-Digital de 10 bits (por el
canal cero se recibe la senal del tacometro). Tambien cuenta con ocho canales
PWM (modulacion de ancho de pulso) de 14 bits de los cuales en este captulo
se usa el CCP1 configurado para trabajar en 8 bits para entregar el voltaje
de control a la planta.
La posicion q1 se mide usando un codificador incremental optico modelo
CP-360-S de Computer Optical Products Inc. [17]. Este dispositivo ya conec-
tado al microcontrolador tiene una resolucion de 1440 cuentas por revolucion.
El codificador incremental es ledo a traves de los pines 5 y 6 del canal A
(vease la figura 14.9). Las cuentas del codificador incremental son recibidas
en dos bytes (de 8 bits cada uno) llamados POSCNTH, el mas significativo, y
POSCNTL, el menos significativo. El valor real de la cuenta se puede calcular
como:
pos = 256 P OSCN T H + P OSCN T L
lo cual es equivalente a hacer 8 corrimientos de POSCNTH hacia la izquierda
para luego sumar POSCNTL. La instruccion q1=(signed long)pos asigna a
la variable q1 el valor numerico de la cuenta que incluye el signo correspon-
diente, es decir positivo si el movimiento es como el mostrado en la figura
14.2 o negativo en caso contrario. Finalmente, la posicion q1 es obtenida en
radianes mediante la operacion:
2 2
q1 = q1, = 0.004363
1440 1440
Es importante mencionar que con el fin de obtener una lectura correcta de
q1 , que represente fielmente la convencion descrita en la figura 14.2 para la
medicion de q1 , es necesario energizar el sistema de control cuando el pendulo
este en la configuracion de reposo que de acuerdo a la figura 14.2 corresponde
a q1 = 0. Lo anterior es para que los registros de posicion queden inicializados
en cero cuando el sistema se encuentre en dicha posicion. La velocidad del
pendulo q1 se calcula a partir de la medicion de q1 , usando diferenciacion
numerica, es decir:
q1 (k) q1 (k 1)
q1 = (14.54)
T
donde k representa el tiempo discreto, q1 representa el estimado de la velocidad
del pendulo en radianes por segundo mientras que Ts = 0.01 s[seg] es el
periodo de muestreo utilizado. De este modo q1 (k) indica el valor de q1 que
se mide en el instante de muestreo actual y q1 (k 1) indica el valor de q1 que
se midio en el instante de muestreo previo.
La velocidad de la rueda q2 se mide usando un tacometro modelo 34PC.
Se trata de un motor de CD tipo miniatura de los utilizados en los telefonos
14.6 Construccion del controlador 689

celulares como vibrador. El voltaje que entrega el tacometro se filtra utilizando


el circuito RC que se muestra en la figura 14.9.
Se encontro que el tacometro utilizado entrega 0.58[V] cuando la veloci-
dad es maxima e igual a 1634 radianes por segundo. Se supuso que cualquier
valor intermedio vara de manera proporcional. Con el fin de mejorar la re-
solucion con que se mide esta velocidad se uso el divisor de tension que se
conecta al pin 4 (ver figura 14.9) para fijar en 3.8372[V] el valor mnimo del
rango analogico del canal 0 del convertidor analogico-digital (el valor maxi-
mo esta fijo en 5[V]). Por otro lado, el tacometro se conecto en serie a otro
divisor de tension de manera que cuando el tacometro esta en reposo (cuan-
do q2 = 0) el voltaje leido por el canal 0 del convertidor analogico-digital
es de (5-3.8372)/2+3.8372=4.4186[V]. Notese que de esta manera se permi-
ten variaciones de aproximadamente 0.58[V] (es decir 1634 radianes por se-
gundo) hacia arriba y hacia abajo del punto medio del rango analogico del
convertidor analogico-digital. As que cuando q2 = 1634[rad/s] el convertidor
analogico-digital entrega la cuenta 1023 = 210 1 (el convertidor AD es de
10 bits) y cuando q2 = 0[rad/s] el convertidor analogico-digital entrega la
cuenta 1023/2 = 511. Cuentas menores a 511 representan valores negativos
de q2 . De acuerdo a esta informacion, la velocidad de la rueda se calcula del
siguiente manera. La instruccion vel=read-adc()-511 asigna a la variable
vel el codigo correspondiente a la velocidad de la rueda mientras que las
instrucciones q2 p=(signed long)vel y q2 p=3.2039*q2 p consiguen asig-
nar a la variable q2 p un valor que es numericamente igual a la velocidad de
la rueda q2 en radianes por segundo (incluyendo su signo). Notese que la cons-
tante 3.2039=1634/510[(rad/s)/cuenta] representa la ganancia del sistema de
medicion.
Con esta informacion se calcula cualquiera de las expresiones en (14.51) o
(14.52), segun sea el caso. El valor de la variable u as obtenida se enva al
PWM del microcontrolador como se describe a continuacion.
Una manera equivalente de implementar la funcion saturacion en (14.51)
con un menor numero de operaciones se realiza sabiendo que u solo tomara va-
lores en el rango de -13 a +13 volts, por lo que su valor se satura por software
para restringirlo a ese rango de valores utilizando instrucciones como las si-
guientes:
if u > 13 then u = 13
if u < 13 then u = 13
Como la resolucion del PWM es de 28 1 = 255 cuentas, entonces la si-
guiente cuenta debe ser enviada al PWM del microcontrolador para entregar
correctamente el valor de u al amplificador de potencia de la planta:
255
cuenta = abs(u)
13
donde abs(u) representa el valor absoluto de u. El signo de u es almacenado
en dos bits de control. La senal del PWM se entrega a un puente H (L293B
690 14 Control de un pendulo con rueda inercial

Figura 14.9. Diagrama electrico del sistema de control.

de SGS-Thomson Microelectronics) que se encarga de amplificar convenien-


temente la potencia de la senal del PWM. Este puente H esta alimentado
con una fuente de potencia de 15.3[V]. Sin embargo, de acuerdo a la hoja de
datos de este dispositivo [18] las cadas de voltaje en el mismo determinan
que en las terminales del motor solo sean aplicados 13[V]. Este dispositivo
tiene dos bits a traves de los cuales se le indica el signo del voltaje que debe
entregar. Para ello, el signo de u se enva al puente H a traves de los bits 0 y
1 del canal D. Esto significa que el voltaje promedio que el puente H entrega
14.7 Resultados experimentales 691

a las terminales del motor solo vara en el rango de -13 a +13 volts. As, se
asegura que en las terminales del motor de CD se aplica un voltaje u cuyo
promedio es numericamente igual al valor de u calculado con cualquiera de
las expresiones en (14.51) o (14.52). Esto es importante porque asegura que la
construccion practica del controlador respeta el diseno indicado por los con-
troladores correspondientes. En la figura 14.9 se muestra el diagrama electrico
usado para construir la estrategia de control (14.51), (14.52), (14.53) en base
al microcontrolador PIC18F4431. Resulta interesante observar la sencillez del
hardware utilizado.

14.7. Resultados experimentales

En las figuras 14.10, 14.11, 14.12, 14.13 y 14.14 se muestran los resultados
experimentales obtenidos. Es importante recordar que es necesario aplicar al
principio un pequeno golpe sobre el pendulo de manera que se abandone el
punto (q1 , q1 ) = (0, 0). Aunque esto se puede evitar si se enva al principio, a
traves del programa, un pequeno pulso de voltaje al motor, sin embargo no
se programo la tarea de esta manera.
En la figura 14.10 se muestra como oscila el pendulo, con amplitudes cada
vez mayores, hasta alcanzar la posicion q1 = con velocidad cero en t 14[s]
y que permanece en esa posicion para todo tiempo futuro. En la figura 14.11
se observa que la velocidad de la rueda permanece constante en un valor de
380[rad/s] a partir de t 17[s]. Aqu es interesante aclarar que la velocidad
de la rueda es regulada en un valor c 150[rad/s] que es el valor de la rueda
en t 14[s], instante en el que el controlador (14.52) empieza a funcionar.
La diferencia entre c y la velocidad final de la rueda 380[rad/s] se debe a
la friccion existente en la rueda y que no ha sido considerada en el diseno
realizado en este captulo.
En la figura 14.12 se muestra la senal de control u. Notese que esta variable
se satura la mayor parte del tiempo durante la etapa en la cual el pendulo es
levantado (t < 14[s]). Esta es la razon por la cual se usan funciones saturacion
y signo en el controlador (14.51). De hecho el valor de 0 = 0.024 se selecciona
4.172
de manera que con este valor y el factor 0.00775 , el valor de u se sature en
13[V].
En la figura 14.13 se muestra como se mueve el pendulo en el mismo plano
que se definio en la figura 14.3 de la seccion 14.3. Es claro que, comparando
ambas figuras, el pendulo se mueve de manera que su energa V crece al pasar
el tiempo (tambien vease la figura 14.14) hasta que V = V0 = 0.2519. Notese
que V alcanza dicho valor desde t 11[s] y sin embargo el pendulo es atrapado
o balanceado hasta t 14[s]. Esta es una prueba de que la energa es regulada
en V = V0 hasta que se alcanza el punto (q1 , q1 ) = (, 0). Es claro que el
pendulo tambien pasa cerca del punto (q1 , q1 ) = (+, 0) en t 13[s] pero no
es atrapado, seguramente porque la condicion en (14.53) no fue satisfecha en
692 14 Control de un pendulo con rueda inercial

q1
[rad]

tiempo [s]
Figura 14.10. Posicion del pendulo conforme se alcanza la configuracion invertida
inestable.

q 2
[rad=s]

tiempo [s]

Figura 14.11. Velocidad de la rueda.


14.7 Resultados experimentales 693

u
[V]

tiempo [s]
Figura 14.12. Voltaje aplicado al motor.

q 1
[rad=s]

q 1 [rad]

Figura 14.13. Evolucion del pendulo en el plano q1 q1 (plano de fase).


694 14 Control de un pendulo con rueda inercial

V
[J]

tiempo [s]
Figura 14.14. Variacion de la energa conforme se alcanza la configuracion invertida
inestable.

ese momento, es decir, el pendulo no paso suficientemente cerca como para


ser atrapado.
Finalmente, en la figura 14.15 se muestra una fotografa donde se observa
al pendulo controlado en la configuracion invertida inestable.

Figura 14.15. El pendulo con rueda inercial controlado en su configuracon inver-


tida inestable.
14.7 Resultados experimentales 695

Programacion del microcontrolador PIC18F4431


Se recomienda consultar la referencia [19] para una explicacion precisa de
cada una de las instrucciones que aparecen en el siguiente listado.
//Programa controlar pendulo con rueda inercial para PCW V3.203
#include<18f4431.h>
#device adc=10 //manejar adc de 10 bits
#include<stdlib.h>
#include<math.h>

#fuses HS,NOWDT,NOPROTECT,PUT,NOLVP,NOBROWNOUT,NOWRTC,MCLR,SSP_RC
#define pi_ 3.14159
//ganancia del controlador no lineal
#define kd 1.0
//ganancias del controlador lineal
#define k1 340
#define k2 11
#define k3 0.0085
//parametros
#define mbg 0.12597
#define R 4.172

#define L 0.0009
#define Kb 0.00775
#define Km 0.00775
#define d11 0.0014636
#define d12 0.0000076

#define d21 0.0000076


#define d22 0.0000076

#define delta 0.3


#define ts 0.01
//con timer=108, cada cuenta vale (4/FXtal)*256 seg

/*DIRECCIONES DE REGISTROS DE INTERES*/


#use delay(clock=11000000)
//Base de tiempo para retardos (11 MHz)
#byte porta = 0xf80
//direcciones de los puertos
#byte portb = 0xf81

#byte portc = 0xf82


#byte portd = 0xf83
#byte portd = 0xf84

#byte TMR0H = 0xfd7


#byte TMR0L = 0xfd6
696 14 Control de un pendulo con rueda inercial

#byte T0CON = 0xfd5

#byte INTCON= 0xff2


#byte TMR5H=0xf88
//Conteo de Encoder Parte alta

#byte TMR5L=0xf87 //Conteo de Encoder Parte Baja

#byte QEICON=0xfB6 //Registro de Configuracion de Modulo de


//Cuadratura

#byte T5CON=0xfB7 //Registro de configuracion de TIMER 5

#byte POSCNTL=0xF66 //CAP2BUFL (registro de cuentas parte baja)


#byte POSCNTH=0xF67 //CAP2BUFH (registro de cuentas parte alta)
#byte CAP1CON=0xF63 //Registro configuracion para reset de base de
//tiempo de captura
#byte PIE3=0xFA3

/*DIRECCIONES DE BITS DE INTERES*/

#bit VCFG1=0xfc1.7 //Bit de configuracion del ADC

#bit PD0=0x0f83.0 //control CCW de puente H


#bit PD1=0x0f83.1
//control CW de puente H
#bit PD2=0x0f83.2
//led en protoboard
#bit PD3=0x0f83.3 //led en protoboard
/*DECLARACION DE VARIABLES*/

float u,q1,q1_p,q1_1,q2_p,q1_d,q2_pd,gr,V,S,nf,i_ts,Je2,V0,RKdeKm;
long pos,vel,inter;
int pwm;
signed int n,mod;

/*PROGRAMA PRINCIPAL*/
void main(void)
{
set_tris_a(0b11111111);
//Configurando E/S de los puertos
set_tris_b(0b00000000);
set_tris_c(0b10000000);
set_tris_d(0b00000000);
portb=0X00;
portc=0X00;
portd=0X00;
//CONFIGURANDO PWM
setup_ccp1(CCP_PWM);
14.7 Resultados experimentales 697

setup_ccp2(CCP_PWM);
setup_timer_2(T2_DIV_BY_16,255,1);
// Configurando lectura del encoder
QEICON=QEICON | (0b00010101);
QEICON=QEICON & (0b01110101);
T5CON=T5CON | (0b00011001);
T5CON=T5CON & (0b10011101);
CAP1CON=CAP1CON | (0b01001111);

setup_timer_1(T1_INTERNAL | T1_DIV_BY_8);
TMR5L=0;
TMR5H=0;
POSCNTL=0;
POSCNTH=0;
//Configurando el ADC
setup_port_a(sAN0);
setup_adc(ADC_CLOCK_INTERNAL);
set_adc_channel(0);
delay_us(50);
VCFG1=1; //-Vref=AN2
INTCON=0;//Apagando interrupciones
//Configurando el timer 0
TMR0L=0;
T0CON=0xC7;
//inicializando variables
i_ts=1/ts;
Je2=(d11*d22-d12*d21)/(2*d12);
V0=2*mbg;
RKdeKm=R*Kd/Km;
q1=0.0;
q1_1=0.0;
q2_pd=0.0;
while (TRUE)
{
PD3=1; //inician calculos del control
q1_1=q1; //actualizando la q1(k-1)
pos=POSCNTH;//registros de posicion en una variable
pos=pos<<8;
pos=pos+POSCNTL;
q1=(signed long)pos;
q1=0.004363*q1; //posicion del brazo en radianes
q1_p=(q1-q1_1)*i_ts; //calculando velocidad del brazo
vel=read_adc()-511; //calculando velocidad de la rueda
q2_p=(signed long)vel;
q2_p=3.2039*q2_p; //velocidad de la rueda en rad/seg
//calculo de q1 deseada
n=q1/pi_;
nf=(float)n;
mod=n%2;
698 14 Control de un pendulo con rueda inercial

if(nf==0)
if(q1>=0) // valor deseado por lado llegada
q1_d=pi_;
else
q1_d=-pi_;
if((nf!=0)&&!PD2)
{
if(q1>=0) // valor deseado por lado llegada
{
if(mod==0)
q1_d=pi_*(nf+1.0);
else
q1_d=pi_*nf;
}
else
{
if(mod==0)
q1_d=pi_*(nf-1.0);
else
q1_d=pi_*nf;
}
}
//fijando zona de operacion de cada controlador
if((q1-q1_d)*(q1-q1_d) + q1_p*q1_p < delta)
{
PD2=1; //calculando control lineal
u= k1*(q1-q1_d) + k2*q1_p + k3*(q2_p-q2_pd);
}
else
{
PD2=0; //calculando control no lineal
V=Je2*q1_p*q1_p+mbg*(1-cos(q1));
V=V-V0;
S=0; //funcion signo
if(V>0)
S=1.0;
if(V<0)
S=-1.0;
u=RKdeKm*q1_p*S; //termina controlador no lineal
q2_pd=q2_p; //velocidad deseada de la rueda
}
//saturacion 13V(15.3 V - 2.3 V de caida en puente H = 13 V)
if(u>13)
u=13;
if(u<-13)
u=-13;
//escalamiento de salida, pwm de 8 bits a 13 V
u=19.6*u;
//piloteando sentido de giro del motor
14.9 Preguntas de repaso 699

if(u>=0)
{
PD0=1;
PD1=0;
}
else
{
PD0=0;
PD1=1;
}
//actualizando el valor del pwm
pwm=(unsigned int)abs(u);
set_pwm1_duty(pwm); //actualizando el valor del pwm
PD3=0; //terminan calculos del control
while(TMR0L<108); //cada cuenta vale (4/FXtal)*256 seg
TMR0L=0;
T0CON=0xC7;
} //cierre del while infinito
} //cierre del main

14.8. Resumen
En este captulo se le ha presentado al lector otro sistema no lineal subac-
tuado conocido como el pendulo con rueda inercial. Se ha mostrado tambien
el modelo matematico del sistema, y en una forma sencilla, se han tratado dos
controladores no lineales que son utiles para la tarea de levantar el pendulo
con rueda inercial. Basados en los captulos previos del libro, se utilizo un con-
trolador por retroalimentacion completa del estado para la tarea de atrapar
el pendulo con rueda inercial linealizado en su posicion vertical invertida. Con
la finalidad de clarificar en su mayora los aspectos involucrados en llevar los
conocimientos teoricos a la practica, se mostro la construccion e identificacion
de los parametros de un sistema pendulo con rueda inercial prototipo. Se ha
finalizado con la electronica y la programacion de los dispositivos necesarios
para la realizacion de experimentos con el prototipo del pendulo con rueda
inercial construido.

14.9. Preguntas de repaso

1. Diga que grado de libertad del IWP es no actuado.


2. Por que el IWP tuvo que oscilar varias veces antes de alcanzar la posicion
vertical invertida?
3. Que hubiera sucedido si el voltaje umax en lugar de ser de 13[V] fuera de
7[V].?
700 14 Control de un pendulo con rueda inercial

4. Cuanto vale la frecuencia de corte en [rad/s] y en [Hz] del filtro RC del


tacometro mostrado en la figura 14.9?
5. Por que mientras el sistema de control esta levantando el IWP la senal
de voltaje de la figura 14.7 va dismunuyendo su amplitud?
6. Por que mientras el sistema de control esta levantando el IWP la senal
de voltaje de la figura 14.12 mantiene su amplitud entre 13[V] y -13[V]?
7. Identifique en que lnea del programa del microcontrolador se manda apa-
gar el led conectado a la terminal 22 del PIC18F4431.
Referencias

1. R. Kelly, V. Santibanez, and A. Loria, Control of robot manipulators in joint


space, Springer, London, 2005.
2. M. W. Spong, P. Corke, and R. Lozano, Nonlinear control of the reaction wheel
pendulum, Automatica, vol. 37, no. 11, pp. 1845-1851, 2001.
3. R. Olfati-Saber, Global stabilization of a flat underactuated system: the inertia
wheel pendulum, Proc. of the 40th IEEE Conf. on Decision and Control, Orlando,
Florida, pp. 3764-3765, 2001.
4. R. Ortega, M. W. Spong, F. Gomez-Estern and G. Blankenstein, Stabilization
of a class of underactuated mechanical systems via interconnection and damping
assignment, IEEE Transactions on Automatic Control, vol. 47, no. 8, pp. 1218-
1233, 2002.
5. S. Afkhami, M. J. Yazdanpanah, and P. J. Maralani, Stabilization of inertia wheel
pendulum using output feedback back-stepping, Proc. of IEEE Conf. on Control
Applications, vol. 2, pp. 977-982, 2003.
6. D. M. Alonso, F. I. Robbio, E. E. Paolini, and J. L. Moiola, Modelling an inertia
wheel pendulum benchmark, Mathematical and Computer Modelling of Dynamical
Systems, vol. 11, no. 3, pp. 255-272, 2005.
7. R. Kelly and R. Campa, IDA-PB control of the inertia wheel pendulum: the
Lagrangian approach (in Spanish), Revista Iberoamericana de Automatica e In-
formatica Industrial, vol. 2, no. 1, pp. 36-42, 2005.
8. V. Santibanez, R. Kelly, and J. Sandoval, Control of the inertia wheel pendulum
by bounded torques, Proc. of the 44th IEEE Conf. on Decision and Control, and
European Control Conf. CDC-ECC 05, Seville, Spain, pp. 8266-8270, 2005.
9. M. Abrahantes, J. Mulder, and K. Butter, Modeling, identification and control
of an under actuated inertial wheel pendulum, Proc. of the 39th Southeastern
Symposium on System Theory, Macon, Georgia, pp.1-5, 2007.
10. N. Qaiser, N. Iqbal, A. Hussain, and N. Qaiser, Exponential stabilization of a
class of underactuated mechanical systems using dynamic surface control, Inter-
national Journal of Control, Automation, and Systems, vol. 5, no. 5, pp. 547-558,
2007.
11. R. V. Carrillo-Serrano and V. M. Hernandez-Guzman, Control of the inertia
wheel pendulum taking into account the actuator dynamics, International Journal
of Innovative Computing, Information and Control, vol. 6, no. 12, pp. 5553-5563,
2010.
702 Referencias

12. H. Khalil, Nonlinear Systems, 3rd Edition, Prentice-Hall, Upper Saddle River,
2002.
13. A.L. Fradkov, P.Y. Guzenko, D.J. Hill, and A.Y. Pogromsky, Speed gradient
control and passivity of nonlinear oscillators, Proc. 3rd. IFAC Symposium on Non-
linear control systems (NOLCOS95), vol. 2, pp. 655-659, 1995.
14. Hibbeler R. C., 2004, Mecanica vectorial para ingenieros. Dinamica, (10a. edi-
cion), Pearson Educacion, Mexico.
15. M. Alonso and E.J. Finn, Fsica, Addison-Wesley Iberoamericana, Wilmington,
Delaware, 1995.
16. PIC18F4431 Enhanced Flash Microcontroller, Data sheet, Microchip Techno-
logy Inc., 2007.
17. CP360S Housed Encoder, Computer Optical Products Inc.,
www.opticalencoder.com.
18. L293B Push-Pull Four channel drivers, Data sheet, SGS-Thomson Microelec-
tronics, 1993.
19. Custom Computer Services Incorporated, CCS C Compiler Reference Manual,
2003.
Indice alfabetico

Adelanto de fase, 314 Ecuacion de Shockley, 475


Ancho de banda, 337 Ecuacion dinamica
Atraso de fase, 315 ecuacion de estado, 396
ecuacion de estado no lineal, 399
Bode ecuacion de salida, 396
graficas de, 294 lineal invariante en el tiempo, 396
solucion, 411
Ceros, 145
Ecuaciones de Euler-Lagrange, 647, 672
lazo abierto de, 224
lazo abierto, efecto de, 231, 335 Eigenvalores, 409
Circuito de senal pequena, 473 Energa, 17
Compensadores de adelanto, 320 almacenada en un resorte, 22, 24
Componentes de frecuencia cero, 305 cinetica, 20, 23, 648, 672, 674
Componentes de frecuencias grandes, de un campo magnetico, 41
303 en sistemas de fluidos, 18
Condicion en sistemas electricos, 18
angulo de, 224 en sistemas mecanicos rotativos, 18
magnitud de, 224 en sistemas mecanicos traslacionales,
Conexion 18
en cascada, 179 en un capacitor, 26
en lazo cerrado, 181 en una inductancia, 25
en paralelo, 180 magnetica, 579
Constante de tiempo, 103, 337 potencial, 650, 673, 674
Control de corriente, 504 Entrada, 102, 145
Controlabilidad
Entrada de prueba
definicion, 414
escalon, 202
prueba, 414
parabola, 203
Criterio de Nyquist
caso especial, 332 rampa, 202
caso general, 333 Espectro de frecuencias, 301
Estabilidad, 145, 413
Decada, 309 marginal, 145
Decibeles, 294 Estado, 395
Disipador, 27 estimado del, 431
704 Indice alfabetico

Factor de amortiguamiento, 122, 338 PIC18F4431, 687


Filtro Modelo lineal aproximado, 403
pasa altas, 314 Modulador por ancho de pulso, PWM,
pasa bajas, 294, 315 587, 591
Fracciones parciales expansion en, 113
races complejas conjugadas distintas, Objetivo de un sistema de control, 222
135 Observabilidad
races complejas conjugadas repeti- definicion, 416
das, 140 prueba, 416
races reales distintas, 100, 125
races reales repetidas, 110, 130 Pico de resonancia, 310, 337
Frecuencia Polares
de cruce de fase, 335 graficas, 297
de cruce de ganancia, 334, 338 Polinomio caracterstico, 102, 145
de esquina, 310, 337 Polos, 104, 144
Frecuencia natural amortiguada, 123 de lazo abierto, efecto de, 230, 335
Frecuencia natural no amortiguada, 123 lazo abierto de, 224
Fuerza magnetica, 579 lazo cerrado de, 223
Funcion constitutiva, 20, 2224, 27 Potencia
disipada por la friccion viscosa, 28
Funcion de transferencia, 144
disipada por un resistencia electrica,
de ganancia unitaria en estado
30
estacionario, 104, 122, 146
instantanea, 17
estable, 145
Principio de superposicion, 181
fase de una, 308
Puerto, 16, 17, 32
inestable, 145
Punto de equilibrio, 401
lazo abierto de, 223
Punto de operacion, 402, 474
lazo cerrado de, 222
magnitud de una, 308 Rango de una matriz, 409
marginalmente estable, 145 Resonancia, 143, 316
Respuesta
Inestabilidad, 145 en estado estacionario, caractersticas
de, 222
LHopital regla de, 131 forzada, 101, 111, 116, 126
Ley de Faraday, 25, 39, 578 natural, 101, 111, 116, 126
Ley de Hooke, 22, 24 transitoria, caractersticas de, 222
Ley de Kirchhoff de corrientes, 70 Ruido, 305, 315
Ley de Kirchhoff de Voltajes, 67, 578
Ley de la Conservacion de la Materia, Salida, 102, 145
105 Segunda Ley de Newton, 20, 22, 579
Ley de Lenz, 39 Series de Fourier, 301
Ley de Ohm, 30 Sistema de control en lazo cerrado, 181,
201, 222
MagLev, 576 Sistema inestable, 577
Margen Sobre paso, 118
fase de, 334, 338
ganancia de, 335 Teorema
Matriz no singular, 408 valor final del, 99
Microcontrolador Tercera Ley de Newton, 43
PIC16F877A, 558, 657 Tiempo de subida, 118, 337
Indice alfabetico 705

Tipo de un sistema, 201 definicion, 395


Transformacion lineal, 425 Variables generalizadas
Transformada acumulacion de esfuerzo, 19, 21, 23,
Laplace de, 98 25
Fourier de, 301 acumulacion de flujo, 19, 20, 23, 26
Trayectoria de Nyquist, 330 esfuerzo, 17
modificada, 333 flujo, 17
Vectores
Variables de estado linealmente dependientes, 407
criterio de seleccion, 395 linealmente independientes, 407
Control Automatico
Teora de diseno, construccion de prototipos,
modelado, identificacion y pruebas experimentales

Hecho en Mexico
Impreso por:
Esteban Becerril Camargo
Simon Bolvar No. 118, Col. Centro,
Deleg. Cuauhtemoc, Mexico, D.F., C.P. 06080

1,000 Ejemplares, Junio de 2013

También podría gustarte