Está en la página 1de 168

Modelado en el accionar con friccin de un

brazo robtico utilizando un controlador PD ms


Red Neuronal
TESIS
que para obtener el grado de Maestro en
Ciencias (Matemticas Aplicadas e Industriales)
presenta
Miguel Isaas Castillo Espnola

Director de tesis:
Dr. Joaqun Delgado Fernndez

Junio de 2010

INDICE
1. INTRODUCCION............................................................................................................................................................................2
1.a. Introduccin sobre Control.....................................................................................................................................................2
1.b. Objeto de la Tesis .....................................................................................................................................................................7
2. NORMAS VECTORIALES ...............................................................................................................................................................8
2.a. Normas vectoriales y matriciales...........................................................................................................................................8
3. SISTEMAS LINEALES INVARIANTES EN EL TIEMPO LIT ........................................................................................................... 15
3.a. Sistemas Dinmicos............................................................................................................................................................... 15
3.a Definicin de Sistemas Dinmicos Lineales Invariantes en el tiempo........................................................................... 16
Un sistema dinmico de control viene descrito por un sistema de la forma .................................................................... 16
3.b. La funcin de transferencia ................................................................................................................................................ 17
3.c. Obtencin del Modelo de Estado ..................................................................................................................................... 18
3.d. Solucin de la Ecuacin de Estado de Sistemas Lineales ........................................................................................... 20
3.e. Controlabilidad y Observabilidad en Sistemas Lineales Invariantes............................................................................ 23
3.f. Estabilidad en sistemas LIT..................................................................................................................................................... 27
4. ESTABILIDAD EN SISTEMAS NO-LINEALES ............................................................................................................................... 29
4.a. Anlisis por linealizacin...................................................................................................................................................... 29
4.b. Anlisis de la estabilidad por el mtodo de Lyapunov................................................................................................. 33
4.b.2. Ejemplos del Mtodo Directo .......................................................................................................................................... 43
5. CONTROL DE SISTEMAS ADAPTATIVOS ............................................................................................................................... 51
5.a. Problema de Identificacin: caso escalar ....................................................................................................................... 51
5.b. Leyes adaptativas................................................................................................................................................................ 53
5.c. Ganancias adaptativas ...................................................................................................................................................... 55
5.d. Simulacin de identificacin de una planta lineal......................................................................................................... 55
5.e. Identificacin de plantas no-lineales ............................................................................................................................ 59
5.f. Control directo; el caso escalar........................................................................................................................................... 63
5.g. Control por retroalimentacin ............................................................................................................................................ 64
6. REDES NEURONALES PARA CONTROL................................................................................................................................. 70
6.a. Introduccin ........................................................................................................................................................................... 70
6.b. Estructura de la Red Neuronal ............................................................................................................................................ 73
6.c. El algoritmo de Retropropagacin ................................................................................................................................... 74
6.d. Aproximacin a funciones continuas con la Red Neuronal ......................................................................................... 77
7. PERTURBACIONES ...................................................................................................................................................................... 78
7.a. Tipos de perturbaciones....................................................................................................................................................... 78
7.b. Friccin en servomecanismos ............................................................................................................................................. 80
8. CONTROLADOR DE RETROALIMENTACION LINEAL TIPO PD............................................................................................. 83
8.a. Un sistema amortiguado con friccin ............................................................................................................................... 83
8.b. Ecuaciones Euler-Lagrange para un brazo robtico ..................................................................................................... 86
8.c. Dinmica del brazo robtico .............................................................................................................................................. 89
8.d. Diseo del controlador de retroalimentacin lineal tipo PD ........................................................................................ 91
9. CONTROLADOR PD Y RED NEURONAL ................................................................................................................................ 102
9.a. Estructura del controlador PD y red neuronal................................................................................................................ 102
9.b. Reglas de ajuste de pesos ................................................................................................................................................. 106
10. CONTROLADOR PD Y RED NEURONAL AUMENTADA ROBUSTA ................................................................................... 115
10.a. Ampliacin de la red neuronal....................................................................................................................................... 115
10.a.1. Redes Neuronales para aproximacin de funciones con discontinuidades ................................................. 115
10.b. Control adaptativo robusto en la red neuronal ......................................................................................................... 121
10.c.
Control por pasividad en la red neuronal .............................................................................................................. 126
10.d.
Controlador final PD y red neuronal con redes aumentadas ............................................................................ 131
10.d.1. Aproximacin de la Red Neuronal y la No-linealidad en el problema de Parmetros .............................. 131
10.e. Simulaciones....................................................................................................................................................................... 139
11. OBSERVACIONES Y CONCLUSIONES.................................................................................................................................. 143
11.a. Observaciones.................................................................................................................................................................. 143
11.b. Conclusiones ..................................................................................................................................................................... 144
R E F E R E N C I A S...................................................................................................................................................................... 145
A N E X O .............................................................................................................................................................................. 147

1. INTRODUCCION
1.a. Introduccin sobre Control
La teora del control comienza a mediados del siglo XIX cuando el funcionamiento de
reguladores mecnicos comenzaba a ser analizados de una manera matemtica. Aquellos
reguladores actuaban de una manera estable si todas las races de los polinomios caractersticos
estaban contenidas en la parte izquierda del plano complejo. Hoy en la teora de control diversos
aspectos de estabilidad estn presentes.
La teora de control ha estado fuertemente ligada con las matemticas a partir de la mitad del
siglo pasado y ha tenido considerable influencia sobre el clculo de variaciones, la teora de
ecuaciones diferenciales y la teora de procesos estocsticos.
Los sistemas de control automtico, que tienen sus orgenes en la ms remota antigedad

han

sustentado sus races en las matemticas aplicadas y se estn convirtiendo, de manera ms


creciente, en componentes esenciales y crticos de cualquier sistema dinmico. El control es una de
las pocas disciplinas que trasciende las fronteras de los campos tradicionales de la ingeniera
(mecnica, elctrica, qumica, nuclear, etc.)
El enfoque de Poincar (finales del siglo XIX) al estudio de problemas dinmicos rpidamente se
populariz y se vino a conocer como mtodo del espacio de estado. As el concepto de estado se
hace dominante en el estudio de los sistemas dinmicos. Las variables de estado representan pues la
mnima cantidad de informacin que nos resume todo el pasado dinmico del sistema y es todo lo
que necesitamos conocer para poder predecir su evolucin futura frente a cualquier seal de
entrada que le apliquemos.
La utilizacin del tratamiento del espacio de estados condujo rpidamente a una comprensin
profunda de los problemas cientficos y matemticos del control y se puede considerar que su
introduccin marca la emergencia de este como una disciplina cientficamente madura.
Por los cuarentas, ingenieros elctricos, mecnicos y qumicos fueron diseando inventos de
control automtico en sus respectivos campos para llegar usando mtodos muy similares en
diferentes rutas y esbozados bajo terminologas completamente diferentes. Aunque al principio no
haba conexin entre esos desarrollos, fue reconocido gradualmente que los conceptos tenan una
base comn y para el final de la segunda guerra mundial, vino a aparecer una teora que era
elegante matemticamente y universal. En los ltimos cuarenta aos el control por retroalimentacin
ha evolucionado de un arte a la disciplina de una ciencia, la cual cruza las fronteras extendidas del
diseo, desarrollo y produccin por una parte y de las matemticas por el otro.

De hecho, a principios de los sesentas, Bellman deca:


2

la teora de control ha emergido como una disciplina matemtica que puede existir
independientemente de sus aplicaciones.
La teora del control automtico ha dado testimonio del constante esfuerzo hacia el
incremento de la velocidad y la precisin. Mtodos de respuesta frecuencial fueron desarrollados
basados en los esfuerzos de Black, Nyquist y Bode en el diseo de amplificadores de retroalimentacin
electrnicos. Usando estos mtodos que ahora son clasificados bajo el rublo de Control Clsico, fue
posible llevar a cabo tanto el anlisis como la sntesis de sistemas de lazo cerrado de una manera
sistemtica basados en respuestas frecuenciales de lazo abierto. En el curso del tiempo, estos
mtodos formaron los fundamentos de la teora del control por retroalimentacin y llegado a
adecuarse idealmente para el diseo de sistemas lineales de tiempo invariante. En los cincuentas y
sesentas con el desarrollo de la tecnologa espacial, el problema de control por retroalimentacin
creci y se hizo ms complejo. Requerimientos estrictos de precisin, peso y costo de las aplicaciones
espaciales apresur el crecimiento de nuevas tcnicas para el diseo de sistemas de Control ptimo.
Modelos con mas de una variable dependiente aparecieron comnmente y anunciaban la era
del Control Multivariable. Finalmente, la inevitable presencia de ruido tanto en las variables de
entrada como en la salida aparecido por la esttica de las soluciones para los problemas de
estimacin y control. Y el campo de prueba de una mezcla de tcnicas de control con aquellas que
estaban bien establecidas. As la solucin del problema del Regulador Gaussiano Cuadrtico Lineal
usando el principio de separacin y el desarrollo del filtro Kalman llegan a ser hechos sobresalientes
en el campo en los sesentas.
An cuando los mas grandes esfuerzos fueron hechos en la precisin del control. Los modelos
lineales no fueron a menudo encontrados ser de gran validez y ms descripciones de precisin del
proceso fueron necesarias. Los modelos simples del proceso tenan que ser reemplazados por unos
mas complejos y consideraciones de incertidumbre en las entradas, valores de parmetro y estructura
del sistema incrementaron su aparicin en el cuadro. La importancia en el diseo de controladores
rpidos y precisos cambio la atencin del control automtico hacia reas tales como los Sistemas
Adaptativos, Sistemas Auto-optimizables y Sistemas Auto-organizables.
Dos conceptos estructurales fundamentales para la comprensin de los sistemas dinmicos que
son controlabilidad y observabilidad fueron introducidos.
Se defini un sistema de control como un arreglo de componentes fsicos conectados de tal
manera que el arreglo se pueda comandar, dirigir o regular a s mismo o a otro sistema
dinmicamente o activamente.
Las entradas y salidas del sistema se definen para un sistema de control como:
La entrada; en un sistema es el estmulo o excitacin que se aplica a un sistema de control
desde una fuente de energa externa, generalmente con el fin de producir, de parte del sistema de
control. Una respuesta previamente especificada.
3

La salida; en un sistema de control se define como la respuesta obtenida del sistema de control.
Puede ser o no igual a la respuesta especificada que la entrada implica.
Los sistemas de control se clasifican en dos grandes categoras.
Sistema de Control de Lazo Abierto. Es aquel en el cual la accin de control es independiente de la
salida.
Sistema de Control de Lazo Cerrado. Es aquel en el cual la accin de control es de cierto modo
dependiente de la salida.
Calibrar. Significa establecer o restablecer una relacin entre la entrada y la salida con el fin de
obtener del sistema la exactitud deseada.
Los sistemas de lazo abierto tienen tres rasgos sobresalientes.
1.- La habilidad que estos tienen para ejecutar una accin con exactitud est determinada por
su calibracin.
2. Estos problemas no tienen problemas de inestabilidad.
3.- Son susceptibles a tener variaciones importantes causadas por el efecto que causan las
perturbaciones cuando ellas afectan al sistema.
Por otra parte, la Retroalimentacin es la caracterstica principal de los sistemas de lazo cerrado, la
cual permite que la salida (o cualquier otra variable controlada del sistema) sea comparada con la
entrada al sistema (o con una entrada a cualquier componente interna del sistema o con un
subsistema de este) de tal manera que se pueda establecer la accin de control apropiada como
funcin de la entrada y la salida y evitar as el no poder alcanzar los objetivos deseados.
El problema de los sistemas de control es de dos tipos. El anlisis y el diseo del sistema deseado.
Diseo por anlisis. Se lleva acabo modificando las caractersticas de un sistema existente de un
modelo estndar del sistema.
Diseo por sntesis. Definiendo la forma del sistema directamente a partir de sus especificaciones
El Modelo, forma susceptible a ser sometida a anlisis, diseo y evaluacin que puede representarse
por medio de:
1.- Ecuaciones diferenciales y otras relaciones matemticas.
2.- Diagramas de bloque
3.- Grficas de flujo de seales
A continuacin se presenta la configuracin bsica de un sistema de control simple de lazo cerrado
(por retroalimentacin) que est representado por diagrama de bloques.

Perturbacin
u
Entrada de
Referencia
r
+

Seal Impulsora
e=r b

Seal de Control
Elementos de
Control
m
g1
TRAYECTORIA DIRECTA

Planta
g2

Salida Controlada
c

Seal de Retroalimentacin
Primaria

g1,g2 y h son funciones de tiempo

Elementos de
Retroalimentacin
h
TRAYECTORIA DE RETROALIMENTACION

SISTEMA DE CONTROL RETROALIMENTADO

La Planta denotada por g2 llamada tambin sistema controlado, es el cuerpo, proceso o


mquina de la cual se va a controlar una cantidad o condicin particular. Los elementos de control
g1, tambin llamados el Controlador son los componentes requeridos para generar la seal de control
apropiada m que se aplica a la planta. Los elementos de retroalimentacin h son los componentes
que se requieren para establecer la relacin funcional entre la seal de retroalimentacin primaria b
y la salida controlada c; es esa cantidad o condicin de la planta que se controla. La entrada de
referencia r es una seal externa aplicada a un sistema de control por retroalimentacin con el fin de
ordenar a la planta una accin especificada, a menudo representa un comportamiento ideal de la
salida de la planta. La seal de retroalimentacin primaria b es una seal que es funcin de la salida
controlada c, y que se suma algebraicamente a la entrada de referencia r para obtener la seal
impulsora e. La seal impulsora e, tambin denominada el error o la accin de control, es la suma
algebraica de la entrada de referencia r mas o menos (usualmente menos) la retroalimentacin
primaria b. La variable manipulada

m (seal de control) es esa cantidad o condicin que los

elementos de control g1 aplican a la planta g2. Una perturbacin u es una seal de entrada
indeseable que afecta el valor de la salida controlada c. Puede entrar a la planta sumndose con m
o a travs de un punto intermedio, como se muestra en el diagrama en bloque de la figura. La
Trayectoria Directa es la va de transmisin desde la seal impulsora e hasta la salida controlada c.
La Trayectoria de Retroalimentacin, es la va de transmisin desde la salida controlada c hasta la
seal de retroalimentacin primaria b.
Generalmente un controlador o compensador es requerido para filtrar la seal de error, para
que el criterio de control sea cierto o las especificaciones sean satisfechas, este criterio puede
involucrar, pero sin ser limitado a lo siguiente:
1.- Rechazo de perturbaciones
2.- Errores del estado estable
3.- Caractersticas de las respuestas transitorias
5

4.- Sensibilidad a cambios en los parmetros de la planta.


Hay tres aspectos importantes sobre el modelado matemtico: Representacin, Precisin y
Generalizacin en relacin al diseo del modelo que de solucin al problema fsico.
La representacin matemtica del fenmeno fsico:
El fenmeno fsico debe estar representado adecuadamente por un sistema dinmico, los
estados de las variables, las entradas, las salidas. Poder saber el estado del sistema para distintos
momentos. Otro aspecto importante es la precisin del modelo que permite lograr los objetivos
consistentemente a pesar de la presencia de perturbaciones. La generalizacin nos permite llegar a
conclusiones en relacin al comportamiento del sistema ante la consideracin inicial de los
parmetros y con esto delimitar el conocimiento del comportamiento del sistema dinmico.
El incremento reciente en la complejidad de los sistemas hechos por el hombre, ha forzado a
posturas severas sobre el diseo de las tcnicas de los controladores modernos; requerimientos de
desempeo mas rigurosos en cuanto a velocidad

de

respuesta

y precisin

en objetivos, han

cambiado los lmites del control moderno. Adems, la tolerancia actual a faltas y fallas demanda
que los controladores tengan caractersticas de sistemas inteligentes.
Los sistemas complejos tienen perturbaciones desconocidas, dinmicas
inestabilidades que no estn estructuradas; por ejemplo, los
sistemas modernos

tienen

importantes

no

actuadores

modeladas

que

dirigen

e
los

no-linealidades debidas a la friccin, zonas muertas,

retrocesos por holguras en los mecanismos y retrasos en tiempo.


Aqu se presenta el diseo mejorado de un controlador el cual se basa en redes neuronales
y que se dirige junto con la dinmica del sistema de control con PD. Los
Neuronales RN pertenecen

una

gran categora

sistemas

llamada estructuras de

de

Redes

redes no-lineales

que tienen propiedades de gran importancia para sistemas de control por retroalimentacin.
Estas redes artificiales estn formadas por interconexiones de mltiples nodos y pueden
aprender por la modificacin de los pesos de los nodos interconectados; este proceso es el llamado
tuning (ajuste). Cambiando los pesos, se cambia el conocimiento almacenado en la red, en efecto,
los valores de los pesos representan la memoria de la red. Aqu veremos que algunos aspectos de
control estn vinculados a algunos aspectos de la teora de las Redes Neuronales, su rpida
convergencia del error de seguimiento es comparable a la de controladores adaptativos directos.
Por Control de un Proceso debemos comprender, cualitativamente, la habilidad para dirigir,
alterar o mejorar su funcionamiento, y un sistema de control es aquel en el cual algunas cantidades
de inters son mantenidas en un valor preescrito con ms o menos precisin. Un control se hace
verdaderamente automtico cuando los sistemas son hechos para que se autoregule. La esencia del
concepto de Retroalimentacin esta en la terna: medicin, comparacin y correccin. Por medicin
6

de las cantidades de inters, comparacin con el valor deseado y uso del error para correccin del
proceso, la cadena acostumbrada de causa y efecto en el proceso se convierte en un lazo cerrado
hacia el interior de sucesos interdependientes.
Para el pensamiento comn de las personas, automatizacin significa reemplazar trabajo humano
por mquinas, esto trae consigo miedo y desconfianza, sin embargo mientras la automatizacin
elimina algunos trabajos en soldadura, maquinado o ensamble en lneas de trabajo; se crean otros
tales como: instalacin y mantenimiento de robots, desarrollo de software y dems. Al mismo tiempo
el incremento en la productividad trada por la automatizacin hace capaz a la sociedad de
competir exitosamente en una economa global con el resultado que el nivel de vida se eleva. En el
presente el robot representa la ms elevada forma de automatizacin. Una clase general de
procesos industriales tiene la estructura de un sistema dinmico precedido por las no-linealidades del
actuador. Problemas en el control de estos procesos son exacerbados cuando la precisin requerida
es alta, como en mecanismos de microposicionamiento. Debido a la naturaleza no-analtica de las
no-linealidades del actuador y el hecho que sus funciones no-lineales exactas son desconocidas, tales
procesos representan todo un reto para el diseador matemtico de control.

1.b. Objeto de la Tesis


La motivacin principal en la elaboracin del presente trabajo estriba en mostrar las bases
tericas y tcnicas recientes en el diseo de controladores mejorados con redes neuronales que
permiten que los brazos manipuladores acten siguiendo una trayectoria a una determinada
velocidad, logrando establecerse los mrgenes y valores para la estabilidad y el error que permitan
un desempeo que alcance valores importantes en cuanto a precisin y confiabilidad; considerando
la presencia de no linealidades por perturbaciones internas propias de dinmicas no modeladas y las
perturbaciones externas en este caso representadas por el fenmeno de la friccin.
El perfilado general del Objeto de la Tesis est en lograr los siguientes puntos:
a) Dar las bases para el diseo estable de tres distintos controladores para el accionar de un brazo
manipulador.
b) Comparar sus desempeos bajo condiciones ideales (sin perturbacin) y bajo condiciones reales
(con perturbacin).
c) Analizar sus distintos desempeos conforme a requisitos impuestos ya sea en cuanto a una
posicin deseada o en cuanto al seguimiento de una trayectoria de referencia.
d) Establecer conclusiones y ventajas.
En el primer diseo de controladores se trata con un Controlador de Retroalimentacin Lineal
Proporcional-Derivativo, llamado solamente Controlador PD, el segundo un controlador compuesto,
7

formado por un Controlador PD mas un Controlador de Redes Neuronales y el tercero tambin es un


controlador compuesto de un Controlador PD mas un Controlador de Redes Neuronales
Aumentadas.
Se consideran en el primer estado condiciones ideales de funcionamiento en el sistema, es
decir sin perturbaciones externas, en el segundo estado se incluyen en el sistema perturbaciones
externas debidas a la friccin.
Los modelos y los diseos estn en base las teoras de Sistemas Lineales, de Sistemas NoLineales y los Sistemas Adaptativos Estables. La estabilidad de los sistemas es comprobada utilizando
principalmente el mtodo directo de Lyapunov. Adicionalmente

se utilizan varios conceptos y

algoritmos de algunas tcnicas de control como son: Control por Retroalimentacin, Control con
Redes Neuronales, Control Robusto, Control por Pasividad y Control Multivariable.
Se analizan las ventajas y limitaciones de los tres diferentes controladores en cuanto al
modelado y reduccin del error as como su capacidad de rechazo a las perturbaciones

2. NORMAS VECTORIALES
2.a. Normas vectoriales y matriciales
El espacio Euclideano n-dimensional se denota por
+

es el conjunto de nmeros reales no negativos.

complejos.

es denotado tambin como

denota el conjunto de todos los nmeros

se refiere al semiplano izquierdo del plano complejo, y

. El smbolo

sirve para denotar una variable compleja y tambin para denotar el operador diferencial
nn

denotar por
el ndice

es el conjunto de todas las matrices de reales ( n

d
.
dt

n ). denota la matriz de identidad se

I , cuyo tamao puede inferirse del contexto. Todos los vectores son vectores columna y

denota la transpuesta. El smbolo

norma, denotada por

define la variable anterior. Si

x , es la norma Euclideana

Para cualquier vector x

x = [ x1 , x 2 , ..., x n ] , su
T

x12 + ... + x n2

con componentes xi , recordemos que la norma 1 es la suma

de los valores absolutos de xi , la norma 2 es la raz cuadrada de la suma de los cuadrados de xi , y


la norma es el mximo valor absoluto de xi .
Generalmente.
1/ p

n
p
= xi
i =1

Habra que recordar que todas las normas vectoriales son equivalentes, en el sentido que para
cualquier vector x , existen constantes a1 , a2 tales que

a1 x

x q a2 x

para cualesquiera

normas p, q . Esto significa que cualquier norma puede ser usada mostrar limitacin de seales o
convergencia.
Dada cualquier norma vectorial, la norma-matriz inducida est definida por

Ax

A sup
| x 0
x

Recordando que

A 1 , es igual al mximo de las sumas por columna de los valores absolutos.

A es igual al mximo de las sumas por rengln de los valores absolutos y A

es el mximo Valor

Singular de A .

|| A ||1 = max

j =1,2..,n

|| A || = max

| a

i =1,2..,m

ij

i =1
n

| a

ij

j =1

La norma matricial inducida satisface:

Ax A

x .

Para cualesquiera dos matrices A, B tenemos:

AB A

B .

El producto interno Frobenius es

A, B

= AT B para cualquier matriz B dimensionalmente

compatible. La norma matricial de Frobenius definida por:

2
F

= traza ( AT A ) = aij2

De acuerdo a la desigualdad de Schwarz, tenemos:

A, B
Con

B F.

aij los elementos de A . La norma Frobenius no es una norma inducida para alguna norma

vectorial, pero es compatible con la norma 2 en el sentido que:

Ax 2 A

A menos de que se diga lo contrario, todas las normas sern Frobenius y todas las normas vectoriales
sern norma 2 .
9

Una matriz

Q es definida positiva si xT Qx > 0 para toda x 0 , y semidefinida positiva si

xT Qx 0 para toda x 0 , definida negativa si xT Qx < 0 para toda x 0 , semidefinida negativa si


xT Qx 0 para toda x 0 . Estos son, denotados respectivamente como Q > 0 , Q 0 , Q < 0 y

Q 0 . Si Q es simtrica, entonces es definida positiva si todos los valores propios son positivos,
semidefinida positiva si todos los valores propios son no-negativos, definida negativa si todos los
valores propios son negativos y semidefinida negativa si todos los valores propios son no-positivos.

Una norma para el vector x tambin est definida por


simtrica definida positiva. Estas

norma Q satisfacen la desigualdad de Sylvester

min ( Q ) x xT Qx max ( Q ) x
2

Con

xT Qx donde Q es cualquier matriz

min , max el mnimo y mximo valor singular, respectivamente. Esto tambin significa que
xT Qx min ( Q ) x

Si una matriz simtrica

A es definida positiva, entonces escribimos A > 0 . Si A1 y A2 son

matrices simtricas definidas positivas, podemos escribir

2.b

A1 > A2 si A1 A2 > 0 .

Normas de funciones en espacios 3

Espacios de Banach
Un espacio de Banach es por definicin un espacio vectorial normado completo. Esto quiere
decir que un espacio de Banach es un espacio vectorial V sobre el campo de los nmeros reales o el
de los complejos con una norma

tal que toda sucesin de Cauchy (con respecto a la mtrica

d ( x, y ) = x y ) en V tiene un lmite en V.
Si X e Y son dos espacios de Banach, entonces podemos formar su suma directa X + Y, la cual
tiene una estructura de espacio vectorial topolgica natural pero no una norma cannica. Sin
embargo es un tambin un espacio de Banach para algunas normas equivalentes, por ejemplo:

x y = x + y
p

1
p

,1 p

10

Si M es un subespacio lineal cerrado de un espacio de Banach X, entonces el espacio cociente


X/M es un espacio de Banach tambin.
Cada producto interno define una norma asociada. El espacio de producto interno es
llamado un espacio de Hilbert si esta norma asociada esta completa.
Todo espacio de Hilbert es un espacio de Banach. El recproco tambin se mantiene bajo
ciertas condiciones.

El espacio de todas las funciones continuas f : a, b K definidas sobre un intervalo cerrado

[ a, b ]

tiene la estructura de espacio de Banach si definimos la norma segn

f = sup f ( x ) : x [ a, b]

Este espacio es completo con esta norma, y el espacio de Banach resultante se denota por C a, b .
Relacin con espacios de Hilbert
Como se menciona anteriormente, todo espacio de Hilbert es un espacio de Banach porque,
por definicin, un espacio de Hilbert es completo con respecto a la norma asociada a su producto
interior. No todos los espacios de Banach son espacios de Hilbert. Una condicin necesaria y
suficiente para que un espacio de Banach sea tambin un espacio de Hilbert es la identidad del
paralelogramo:

u +v + u v = 2 u + v
2

para toda u y v en V, y donde es la norma sobre V.

El espacio de Lebesgue L es siempre un espacio de Banach pero slo es un espacio de Hilbert


cuando

p=2.

Si la norma de un espacio de Banach satisface esta indentidad, el producto interno asociado que
forma dentro de un espacio de Hilbert est dado por la identidad de polarizacin.
Si V es un espacio real de Banach, entonces la identidad de polarizacin es:

11

u, v =

1
2
u+v uv
4

y en el caso que V sea un espacio de Banach complejo la identidad de polarizacin est dada por

u, v =

Espacios

Lp

Los espacios

1
2
2
2
u + v u v i u + iv u iv
4

))

Lp
son los espacios vectoriales normados ms importantes en el contexto de la teora de

la medida y de la integral de Lebesgue.


Consideremos

( X , , ) un espacio de medida. Se define el espacio vectorial:

3 , para p 1, )
p

Como el espacio de todas las funciones medibles f que cumplen:

f d <

Asimismo, se define el espacio 3 como el espacio de las funciones medibles f que verifican:

inf a R :

({x X : f ( x ) a}) = 0} <

Es decir, aquellas funciones medibles acotadas. Una norma natural para definir en estos espacios
sera:

( f

Si p < , y

= inf a R :

1
p

({x X : f ( x ) a}) = 0}

Sin embargo, una aplicacin as definida no resulta norma, ya que no se cumple

= 0 f = 0 , pues cualquier funcin que sea igual a la funcin nula, salvo en un conjunto de

medida nula, tendr norma cero.


p

As, se define la siguiente relacin de equivalencia R sobre3 : fRg f = g . Se prueba que


efectivamente es una relacin de equivalencia, y se defina L = 3
p

/ R , es decir., el espacio vectorial


p

cuyos elementos son las clases de equivalencia de la relacin R. Considerando entonces sobre L las
normas anteriormente definidas (donde f es cualquier representante de la clase de equivalencia),
12

se prueba que

resulta ser norma y que su valor no depende del representante de la clase de

equivalencia escogido. Usualmente no se hace distincin entre funcin y clase de equivalencia en


este contexto.
p

1. L es Banach
2

2. L es un Espacio de Hilbert, dotado del producto interno

f , g = f gd .

3. Si p (1, ) , L es reflexivo.
p

4. Si denotamos por E al espacio de las funciones simples, se cumple que E L es denso en L .


p

5. Si p (1, ) , el dual topolgico de L es L donde q es tal que


p

1 1
+ = 1.
p q

6. Si el espacio de medida es -finito, entonces el dual de L1 se identifica con L .


7. El espacio de las funciones infinitamente derivables en un abierto R a soporte compacto y
n

que estn en L con 1 p < , es denso en L , es decir clLp


p

( )

(C ( ) L ( ) ) = L ( ) .

Los espacios L a veces son llamados Espacios de Lebesgue, forman una clase importante de
ejemplos de Espacios de Banach en Analisis funcional y de espacios vectoriales topolgicos. Los
espacio de Lebesgue tienen mltiples aplicaciones en la Fsica e Ingeniera.
Operadores lineales
Si V y W son espacios de Banach sobre el mismo campo K, el conjunto de todos las mapeos Klineales continuos A: V W se denota por L(V, W). Es de notar que en espacios dimensionales infinitos
no todas los mapeos lineales son continuos automticamente. En general un mapeo lineal sobre un
espacio normado es continuo si y slo si este esta acotado sobre una bola unitaria. As, en el espacio
vectorial L(V, W) puede definirse la norma de un operador A, como

A = sup Ax W x V , x V 1

Con respecto a esta norma, L(V, W). es un espacio Banach. Cuando V=W, el espacio
L(V)=L(V,V) forma una Algebra de Banach unitaria; la operacin multiplicacin est dada por la
composicin lineal de mapeos.
Espacios

13

La

norma Lp

puede ser extendida a vectores teniendo un nmero infinito de

componentes, produciendo el espacio


1

que tiene como casos especiales:

es el espacio de series convergentes absolutamente,


es el espacio de sucesiones cuadrticas sumables, el cual es un espacio de Hilbert

es el espacio de sucesiones acotadas.

El espacio de sucesiones tiene una estructura natural de espacio vectorial por la aplicacin de
la adicin y la multiplicacin escalar coordenada por coordenada. Explcitamente, para

x = ( x1 , x2 ,..., xn , xn+1 ,...)

una secuencia infinita de nmeros reales (o complejos) define el vector

Suma como

( x1 , x2 ,..., xn , xn+1 ,...) + ( y1 , y2 ,.... yn , yn+1 ,...) = ( x1 + y1 , x2 + y2 ,..., xn + yn , xn+1 + yn+1 ,...)
Siendo la accin escalar dada por:

( x1 , x2 ,..., xn , xn+1 ,...) = ( x1 , x2 ,..., xn , xn+1 ,...)

Y se define la
El espacio

norma p

Tambin se define la

= x1 + x2 +

norma p

norma

+ xn + xn+1 +
p

1
p

es finita.

como:

= sup ( x1 , x2 ,..., xn , xn+1 ,...)

y el correspondiente espacio

se define entonces como el conjunto de todas las sucesiones infinitas de nmeros reales

o complejos tales que la

= lim x
p

de todas la sucesiones acotadas. Resulta que

si el lado derecho es finito o el lado izquierdo es infinito. Por lo tanto se considera en espacios

para

1 p .
La

norma p

asi definida sobre

espacio de Banach. El espacio

es en realidad una norma, y

es el nico espacio

junto con esta norma es un

que es un espacio de Hilbert ya que

cualquier norma que es inducida por un producto interno debe satisfacer la identidad del
paralelogramo
14

x+ y

+ x y

El espacio

c0

=2 x p +2 y
2

esta definido como el espacio de todas las sucesiones que convergen a cero, con una

norma idntica a

. Es un subespacio cerrado de

, por lo tanto un espacio Banach.

3. SISTEMAS LINEALES INVARIANTES EN EL TIEMPO LIT


3.a. Sistemas Dinmicos
En el estudio de sistemas adaptativos, se restringe la atencin a sistemas dinmicos que son
gobernados por ecuaciones diferenciales ordinarias conteniendo un nmero finito de parmetros. Si

x1 , x 2 , ..., x n representa la n-coordenadas en un espacio Euclideano n-espacio R n y t el tiempo, el


funcionamiento de un tpico sistema dinmico dimensional-finito es descrito por las ecuaciones
diferenciales

x1 ( t ) = f 1 ( x1 ( t ) , x 2 ( t ) , ..., x n ( t ) , t )

i = 1, 2, ..., n

O de manera equivalente por el vector de ecuacin diferencial

x = f ( x, t )
Donde

x y

. . (2.1)

son vectores columna con componentes

respectivamente. Las variables


vector estado. La notacin

f i ( i = 1, 2, ..., n )

x i son referidas como variables de estado y x es referido como el

x ( t ) indica que los componentes x i de x son funciones de t . Nos

referiremos al espacio dimensional


movimiento

xi y

( n + 1 ) de

las cantidades

M . Si estas son continuas, entonces el punto

segmento curvo en un espacio de movimiento cuando

x1 , x 2 , ..., x n , t como el espacio de

( x ( t ) , t ) se mueve a lo largo de un

t varia sobre un intervalo

[ t1 , t 2 ] .

La

proyeccin del movimiento sobre el espacio de estado es llamada curva de estado, trayectoria del
movimiento, o solucin de la ecuacin (2.1). Si el tiempo inicial es

t 0 , y el valor inicial de x ( t ) es

x ( t 0 ) = x 0 , se denotar la solucin de la Ecuacin (2.1) como

x (t ; x0 , t0 )

donde

x ( t 0 ; x 0 , t 0 ) = x 0 . En los casos donde la condicin inicial es evidente para el contexto, la solucin


es simplemente denotada como

x (t ) .

15

De la existencia del teorema de Caratheodory se sabe que para toda


dominio

( x, t )

perteneciente al

B en M , (i) f ( x , t ) es continua en x para toda t fija, (ii) medible en t para toda x fija, y

( x, t )

( t ) donde ( t ) es integrable en t t 0 entonces para algn 1 > 0 existe

una solucin

x ( t ; x 0 , t 0 ) para t t 0 1 . Se denotarn la clase de funciones que satisfacen las

(iii)

condiciones (i)-(iii) por

F . En este trabajo el inters estar en soluciones de ecuaciones diferenciales

que existan para todo

t t0 .

Una solucin constante


Ecuacin (2.1). Si

x ( t 0 ; x 0 , t 0 ) x 0 es un estado de equilibrio o un punto singular de la

x 0 es la nica solucin constante en la vecindad de x 0 , esto es llamado un estado

de equilibrio aislado. Si el lado derecho de la ecuacin (2.1) no depende de


llamada autnoma. Si
es peridica, Si

t , la ecuacin es

f ( x , t + T ) = f ( x , t ) para alguna constante T , la ecuacin se dice que

f ( x , t ) es lineal en x la ecuacin (2.1) se dice que es una ecuacin lineal y el

correspondiente sistema dinmico que esto representa es referido como un sistema lineal.

3.a Definicin de Sistemas Dinmicos Lineales Invariantes en el tiempo


Un sistema dinmico de control viene descrito por un sistema de la forma

x = f ( t , x, u ) , t [t0 , ), x
y = (t , x, u ), y
donde

, u

f ( t , x , u ) satisface condiciones suficientes para la existencia y unicidad de soluciones, por

ejemplo las condiciones de Caratheodory. Aqu, u es la variable de control y aparece como


parmetro en la elucin diferencial. La variable observable es y; cuando y = x, se dice que el estado
es completamente observable. En general y < n.
Para que un sistema dinmico sea lineal debe cumplirse el siguiente teorema:
Se tiene un sistema que partiendo de un estado inicial x1 ( t0 ) , con una entrada u1 ( ) , t0 t ,
responde con una salida

y1 ( t ) , y a partir de un estado inicial x2 ( t0 ) con una entrada

u2 ( ) , t0 t , responde con otra salida y2 ( t ) . Se dice que dicho sistema es lineal si para a y b
reales,

partiendo

del

estado

inicial

x3 ( t0 ) = ax1 ( t0 ) + bx2 ( t0 ) con

una

entrada

u3 ( ) = au1 ( ) + bu2 ( ) , t0 t , la salida es y3 ( t ) = ay1 ( t ) + by2 ( t ) .


Esta propiedad de linealidad en sistemas diferenciales se traduce en que las funciones

f y
16

son lineales con respecto a x y a u .

f ( t , x1 + x, u1 + u2 ) = f ( t , x1 , u1 ) + f ( t , x2 , u2 )

( t , x1 + x2 , u1 + u2 ) = ( t , x1 , u1 ) + ( t , x2 , u2 ) ,
donde f y

son funciones vectoriales, por lo que la propiedad de linealidad se verifica si y slo si

las ecuaciones del modelo de estado se pueden expresar de forma matricial como:

x ( t ) = A(t ) x ( t ) + B ( t ) u ( t )
y (t ) = C (t ) x (t ) + D (t ) u (t )

modelo de estado matricial

donde:

x ( t ) es el vector de estado, de dimensin n .


u ( t ) es el vector de entradas, de dimensin m .
y ( t ) es el vector de salida, de dimensin p .
A ( t ) n n es la matriz del sistema.
B ( t ) n m es la matriz de entradas.
C ( t ) p n es la matriz de salida.
D ( t ) p m en la matriz de entradas para las salidas (en la mayora de los sistemas se anula)
Los sistemas dinmicos invariantes en el tiempo son aquellos donde las matrices A,B,C, D no
dependen explcitamente del tiempo. Se cumple el siguiente teorema:
Un sistema, con un estado inicial dado por x0 = x ( t0 ) , sometido a una entrada u1 ( ) , t0 t , y
que produce como salida la seal y1 ( t ) , es invariantes en el tiempo si T , partiendo del mismo
estado x0 pero en el instante t0 + T , excitado con una entrada u2 ( + T ) = u1 ( ) , t0 t ,
responde con una salida que es y2 ( t + T ) = y1 ( t )

3.b. La funcin de transferencia


Si el sistema cumple con las condiciones de linealidad e invarianza se puede establecer la
funcin de transferencia la cual rige la relacin entrada-salida la cual es nica sea cual fuere el
modelo de estado del sistema.
17

La expresin de un sistema LIT es:

x ( t ) = Ax ( t ) + Bu ( t )
y ( t ) = Cx ( t ) + Du ( t )
La funcin de transferencia se define como el cociente de las transformadas de Laplace de la
entrada entre la salida, con condiciones iniciales nulas. Tomando transformadas de Laplace en las
ecuaciones anteriores, tomando en cuenta que las condiciones iniciales son nulas, obtenemos

sX ( s ) = AX ( s ) + BU ( s )
Y ( s ) = CX ( s ) + DU ( s )

Despejando X(s) de la primera y sustituyendo en la segunda ecuacin, obtenemos

X ( s ) = [ sI A] BU ( s )
1

1
1
Y ( s ) = C [ sI A] BU ( s ) + DU ( s ) = C [ sI A] B + D U ( s )

de donde la funcin de transferencia es,

G ( s ) = C [ sI A] B + D .
1

Polos del Sistema

Siendo sI A

1
T
Adj [ sI A] , se concluye que el polinomio caracterstico del sistema
det [ sI A]

es: p ( s ) = det sI A por lo que los polos del sistema coinciden con los valores propios de la matriz
A. Se ve tambin que como el polinomio caracterstico slo depende de A, tambin ha de ser as
con la estabilidad del sistema. La posicin de los ceros del sistema viene dada por las matrices A, B, C
y D.

3.c. Obtencin del Modelo de Estado


Conforme a las ecuaciones de estado y de salida del sistema lineal invariante:

x ( t ) = Ax ( t ) + Bu ( t )
y ( t ) = Cx ( t ) + Du ( t )
se pueden deducir las siguientes condiciones que habr que tener en cuenta cuando se elige un
modelo de estado:

En la ecuacin de estado slo pueden estar relacionadas las variables de estado sus primeras
derivadas y las entradas.

En la ecuacin de salida solo pueden estar relacionadas las variables de estado, las entradas y las
salidas.
18

Las variables de estado no pueden presentar discontinuidades, aunque la entrada al sistema si


pueda tenerlas, pues en tal caso la derivada de la variable de estado no estara definida.

Se admiten discontinuidades en las entradas (como por ejemplo una entrada de escaln), por lo
cual nunca pueden elegirse las entradas como variables de estado del sistema.

Representacin en variables de estado de sistemas monovariables


La expresin genrica de un sistema monovariable:

(s

+ an 1s n 1 + ... + a1s + a0 ) y = ( bm s m + ... + b1s + b0 ) u .(a)

puede reescribirse de la siguiente forma como cociente de dos polinomios en el operador derivada

s:

bm s m + ... + b1s + b0
y= n
u ..(b)
s + an 1s n 1 + ... + a1s + a0
El procedimiento consiste en elegir como primera variable de estado x1 :

x1 =

1
s + an 1s
n

n 1

+ ... + a0

lo que quiere decir que x1 es una solucin de la ecuacin diferencial del primer trmino igualada a

u . Se eligen las restantes variables por sucesiva derivacin:

x2 = x1
x3 = x2

xn 1 = xn

xn = s n x1 = an 1s n 1 x1 an 2 s n 2 x1 ... a1sx1 a0 x1 + u
= an 1 xn an 2 xn 1 ... a1 x2 a0 x1 + u
As, el sistema en forma matricial resulta:

0
0
x=

a0

1
0

0
1

0
0

0
a1

0
a2

0
a3

0
0


0
0
0
0
x + u


0
1


an 1
1

La ecuacin de salida queda:

y = ( bm s m + ... + b1s + b0 ) x1
19

pasando esta expresin a notacin matricial se obtiene:

y = ( b0

b1 b2

bm

0) x

Variables de Jordan
Partiendo de la ecuacin (b), la representacin del sistema en variables de Jordan admite la
siguiente forma:

y = bn + 1 + 2 + ... + n
s 1 s 2
s n

Se le asigna una variable a cada uno de estos operadores:

x1 =

1
u
s 1

x1 = 1 x1 + u

x2 =

1
u
s 2

x2 = 2 x2 + u

x3 =

1
u
s 3

x3 = 3 x3 + u

xn =

1
u
s n

xn = n xn + u

Con lo que la ecuacin viene representada por:

1 0

0 2
x=

0 0

0
1

1
0
x + u

n 1

La ecuacin de salida se obtiene como:

y = ( 1

n ) x + bnu

3.d. Solucin de la Ecuacin de Estado de Sistemas Lineales


Matriz de Transicin. Solucin a la ecuacin homognea
El objetivo es solucionar la ecuacin de estado:

x (t ) = A (t ) x (t ) + B (t ) u (t )

20

()

En la ecuacin homognea se supone que la entrada u t es nula, por lo que la ecuacin a resolver
es de la forma:

x (t ) = A (t ) x (t )
Para encontrar la solucin de la ecuacin homognea se puede utilizar el mtodo de integracin por
aproximaciones sucesivas de Peano-Baker, que dice que

dada

una

ecuacin

de la forma

x ( t ) = f ( x(t ), u ( t ) , t )
con condiciones iniciales x ( t0 ) = x0 se puede obtener la solucin de dicha ecuacin construyendo
una secuencia de funciones del tipo:

= x0

k ( t ) = 0 + f (k 1 ( ) ,

( ) , )d

t0

en la que la solucin de la ecuacin diferencial se obtiene como:

x ( t ) = lim k ( t )
k

1 ( t ) = 0 + A ( )x0 d = x0 + A ( )d x0
t

t0

t0

2 ( t ) = 0 + A ( ) x0 + A ( 1 )d 1 x0 d =
t

t0

t0

t0

t0

t0

= x0 + A ( )d x0 + A ( ) A ( 1 )d 1d x0 =

t0

t0

t0

= I + A ( )d + A ( ) A ( 1 )d 1d x0
a medida que progresa la construccin de los sucesivos trminos de la serie, se comprueba que en
todos ellos va apareciendo el trmino

x0 que se puede extraer por la derecha; despus de la

extraccin la expresin tiende a ser:

x ( t ) = ( t , t0 ) x0

donde t, t0

es la llamada matriz de transicin, mediante la que se construye la solucin de la

ecuacin diferencial

( t , t0 ) = e
Cuando la matriz

t0 A( )d

A es invariante la matriz conmuta con su integral de forma que se puede aplicar

la expresin general:

( t , t0 ) = e

t0 Ad

=e

t0 d

=e

A( t t0 )

21

Clculo de la matriz de transicin para el caso LIT


Cuando la matriz

A es invariante se puede calcular la matriz de transicin por el mtodo de Jordan,

esta matriz tiene la forma:

( t , t0 ) = e

A( t t0 )

El mtodo de Jordan consiste en realizar una transformacin:

x = Tx

x = T 1 x

Tal que la matriz del sistema sea tambin transformada segn:

A = T 1 AT
As

( t , t0 ) = T ( t , t0 ) T 1

De esta forma, segn el mtodo de Jordan, el clculo de la exponencial de una matriz se realiza en
los siguientes pasos:

Clculo de la matriz diagonal en bloques de Jordan, mediante el clculo previo de las matrices

T y T 1 . Para el clculo de la matriz T esta se compone, por columnas de los vectores propios
asociados a los valores propios de la matriz A.

Clculo de la exponencial de la matriz diagonal ( t , t0 ) formada por los valores propios de la


matriz

A.

Multiplicacin de esta matriz por las matrices de transformacin para devolver el sistema a su
expresin original ( t , t0 ) .

Un ejemplo
Obtener el modelo de estado y la evolucin de las variables de estado del sistema representado
mediante la siguiente ecuacin diferencial:

y + 6 y + 11 y + 6 y = 0
En primer lugar se han de elegir las variables de estado; en este caso; dado que la ecuacin es de
tercer orden, sern necesarias tres, siendo una posible eleccin:

x1 = y

x2 = y

x3 = y

x1 = x2
x2 = x3
x3 = 6 x3 11x2 6 x1
con lo que el modelo de estado expresado en forma matricial queda:

22

1
0 x1
x1 0


0
1 x2
x2 = 0
x 6 11 6 x
3
3
La reduccin a la forma cannica de Jordan es
1

1
0 1 1 1 3 0 0 1 1 1
0

A= 0
0
1 = 3 2 1 0 2 0 3 2 1
6 11 6 9 4 1 0 0 1 9 4 1

1 1 1 3 0 0 1 3/ 2 1/ 2
= 3 2 1 0 2 0 3 4 1
9 4 1 0 0 1 3 5 / 2 1/ 2

3 t
1 1 1 e

exp(tA) = 3 2 1 0
9 4 1 0

2 + 3 t 3 2 t + 3 t
i
j
j
j
j
3 3 t H1 2 t + 2 t + 2 3 t L
j
j
j
j
3 t 12 2 t + 3 t
k 14 + 9

3 t

1
2

+5

H27 32

t 2

3 t

1
2

1
2

H3 8

3 t

H 1 +

2t

L H9 + 2
t

+5

2t

0 1 3/ 2 1/ 2

0 3 4 1
e t 3 5 / 2 1/ 2

0
e

2 t

0
3 t

1
2

1
2

1
2

H1 +

3 t
3 t

H3 4

H9 8

t 2
t
t

y
z
z
z
z
z
z
z
3t z
2
L{

2t
2t

3.e. Controlabilidad y Observabilidad en Sistemas Lineales Invariantes


Sistema controlable
Se dice que un punto del espacio de estado de un sistema, x1 , es controlable desde el estado x0 en

[t0 , t1 ] si existe una entrada u definida en el intervalo [t0 , t1 ] tal que transfiera el estado del sistema
desde x0 en t0 hasta x1 en t1 .

Un sistema se dice controlable en t0 , t1 si todos los puntos de su espacio de estado son controlables

en t0 , t1

Un sistema se dice controlable si todos los puntos de su espacio de estado son controlables

Controlabilidad en Sistemas LIT


En el caso de sistemas lineales invariantes, la controlabilidad se puede estudiar mediante el siguiente
teorema:

23

Dado el sistema de dimensin n con ecuacin de estado:

x ( t ) = Ax ( t ) + Bu ( t )
es controlable si y slo si la matriz de controlabilidad Q , definida de la siguiente forma:

Q = B AB A2 B ... An 1 B

es de rango mximo, es decir n

El conjunto de puntos del espacio de estado alcanzables partiendo del estado inicial nulo forman un
subespacio vectorial, al que se le denomina subespacio controlable generado por los vectores
columna linealmente independientes de Q .

Controlabilidad de la salida
Se dice que un punto del espacio de salida de un sistema, y1 , es controlable si para todo punto

origen y para todo instante inicial t0 , existe una entrada u definida en el intervalo t0 , t1

con t1 finito,

que lleve la salida al valor y1 en t1 .

Los teoremas de controlabilidad se pueden generalizar como:


Dado el sistema

x (t ) = A (t ) x (t ) + B (t ) u (t )
y (t ) = C (t ) x (t )

la salida es controlable en t0 , t1 si y slo si la matriz definida por:

Wc ( t1 , t0 ) = c ( t1 ) ( t1 , ) B ( ) BT ( ) T ( t1 , ) C T ( ) d
t1

t0

es no singular.

Y para sistemas lineales invariantes


Dado el sistema

x ( t ) = Ax ( t ) + Bu ( t )
y ( t ) = Cx ( t )
la salida y ( t ) es controlable si y slo si la matriz definida por

Qc = CB CAB CA2 B ... CAn 1 B

24

es de rango

p ( notar que Qc = CQ )

Sistema observable
La idea de observabilidad se relaciona con la posibilidad de conocer el valor del estado de un
sistema a partir del conocimiento de la evolucin de la entrada y de la salida que genera.
Una vez conocido el estado en un instante inicial, se puede determinar el estado en cualquier
otro instante posterior utilizando la solucin de la ecuacin de estado. La observabilidad se presenta
conceptualmente como una idea complementaria a la controlabilidad; si la controlabilidad estudia
la relacin entrada-estado, la observabilidad ve la relacin estado-salida.

u(t)

y(t)

Sistema

x(t)

OBSERVABILIDAD

Observabilidad en un instante t0

Se dice que un punto x0 del espacio de estado es observable en t0 , t1 si siendo ste el estado inicial

en el instante t0 , x0 = x ( t0 ) , el conocimiento de la entrada u ( t ) en el intervalo t0 , t1

y de la salida

y ( t ) en el mismo intervalo permite determinar que el estado inicial del sistema en el instante t0 es x0 .
Observabilidad para un punto
Se dice que un punto del espacio de estado, x0 , es observable si siendo ste el estado inicial para un

instante inicial t0 cualquiera, existe un intervalo de tiempo finito t0 , t1 tal que el conocimiento de la

entrada u ( t ) en el intervalo t0 , t1 y de la salida y ( t ) en dicho intervalo permite determinar que el


estado inicial es x0 .

Sistema observable
Un sistema es observable si todos los puntos del espacio de estado son observables
Si fuera conocido x ( t0 ) y u ( t0 ) se podra obtener x ( t ) con la expresin de la solucin completa
25

x ( t ) = ( t , t0 ) x ( t0 ) + ( t , )B ( ) u ( ) d
t

t0

y teniendo en cuenta la ecuacin de la salida:

y (t ) = C (t ) x (t ) + D (t ) u (t ) ;
sustituyendo en esta ecuacin la solucin de la ecuacin de estado:

y ( t ) = C ( t ) ( t , t0 ) x ( t0 ) + C ( t ) ( t , ) B ( ) u ( ) d + D ( t ) u ( t ) ;
t

t0

agrupando los trminos que dependen de la entrada y la salida, que se suponen conocidas se
obtiene:

y ( t ) = y ( t ) C ( t ) ( t , ) B ( ) u ( ) d + D ( t ) u ( t ) = C ( t ) ( t , t0 ) x ( t0 )
t

t0

donde y ( t ) representa la componente de salida debida slo a la existencia de condiciones iniciales


no nulas, es decir, la aportacin a la salida dada por la evolucin libre del sistema, o lo que es lo
mismo la salida del sistema ante entrada nula.
De esta forma se observa que la posibilidad de conocer el estado a partir de la salida y la
entrada depende de C ( t ) y ( t , t0 ) que q su vez depende nicamente de A ( t ) .
En el caso particular de que la matriz C ( t ) es cuadrada e invertible, se puede despejar

x ( t0 ) de la ecuacin anterior:
x ( t0 ) = 1 ( t , t0 ) C 1 y ( t )
o lo que es lo mismo:

( t , t0 ) x ( t0 ) = x ( t ) = C 1 y ( t )
En este caso la salida representa un cambio de base de las variables de estado mediante la matriz C
y por lo tanto basta conocer la salida en un solo instante para conocer el estado del sistema.
Dado un sistema definido por las ecuaciones:

x (t ) = A (t ) x (t ) + B (t ) u (t )
y (t ) = C (t ) x (t ) + D (t ) u (t )

es observable en t0 , t1 si y slo si la matriz V ( t1 , t0 ) definida como:

V ( t1 , t0 ) = T ( , t0 )C T ( ) C ( ) ( , t0 ) d
t1

t0

es no singular.

26

Estados no-observables
El hecho de que exista un valor del estado inicial no nulo, tal que al evolucionar el sistema a partir de
l sin entrada la salida sea nula, hace que el sistema no sea observable, porque si se tiene que un
sistema partiendo de un estado inicial x1 da una salida y1 ( t ) , si existe algn punto x2 tal que al
evolucionar a partir de l la salida es nula, para x3 = x1 + x2 la salida por linealidad, volver a ser

y1 ( t ) , por lo que no se podr distinguir el estado inicial y no se tendr ningn punto del sistema
observable.
Observabilidad para Sistemas Lineales Invariantes
Dado un sistema de dimensin n definido por las ecuaciones:

x ( t ) = Ax ( t ) + Bu ( t )
y ( t ) = Cx ( t ) + Du ( t )
es observable si y slo si la matriz de observabilidad P definida por:

C
CA

P = CA2 es de rango mximo, es decir n

CAn 1

3.f. Estabilidad en sistemas LIT


La estabilidad de sistemas lineales esta bien estudiada, y puede ser considerada el precursor de casi
todos los resultados en la estabilidad de sistemas no-lineales. En esta seccin se suman algunos de los
resultados bien conocidos pertenecientes a los sistemas lineales.
Consideremos un sistema lineal descrito por las ecuaciones diferenciales siguientes:

x (t ) = A (t ) x (t )
donde

x ( t 0 ) = x 0 .. (3.1)

x : R + R n y A : R + R n n . Los elementos de A ( t ) se asume que estn acotados y

ser tramos continuos para toda

t R + . Entonces la ecuacin (3.1) tiene una solucin nica que

puede ser expresada como:

x (t ) = (t , t0 ) x0 ,
para cualquier condicin inicial

x 0 donde ( t , t 0 ) es la matriz de transicin de la Ecuacin (3.1) que

satisface la ecuacin diferencial


27

(t , t0 ) = A (t ) (t , t0 )
Cada columna de

(t0 , t0 ) = I .

( t , t 0 ) representa una solucin linealmente independiente de la ecuacin

diferencial (3.1) y cualquier solucin de la posterior puede ser expresada como una combinacin
lineal de las columnas de

( t , t 0 ) . El desarrollo de las soluciones de la Ecuacin (3,1) pueden ser

agrupadas como sigue:

Teorema 3.f.1
(i) Todas las soluciones de la Ecuacin 3.1 estn acotadqs si y slo si

( t , t 0 ) k donde k es una

constante positiva.
(ii) Todas las soluciones de la Ecuacin 3.1 tienden a cero cuando

t , si y slo si

( t , t 0 ) 0 cuando t .
Para sistemas generales de tiempo variante, la determinacin de la forma analtica de la matriz de
transicin es una tarea difcil y por lo tanto, las condiciones del Teorema 3.f.1 son difciles de verificar.
Para el caso especial cuando el sistema es de tiempo invariante, las condiciones analticas del
Teorema 3.f.1 pueden transformarse en condiciones algebraicas.
Cuando el sistema es lineal y de tiempo invariante, descrito por la ecuacin diferencial

x ( t ) = A x ( t ) .. (3.2)
donde

A es una matriz constante, la matriz de transicin ( t , t 0 ) esta dada por


A (t t0 ))
(t , t0 ) = e (
,

Utilizando la transformacin de similaridad

A = T T 1 donde es la forma cannica de Jordan de

A , la matriz de transicin y, por lo tanto las condiciones del teorema 3.f.1 puede ser evaluada
usando la identidad

e ( A t ) = T e ( t )T 1
Teorema 3.f.2
1.- Todas las soluciones de la Ecuacin (3.2) son acotadas si y slo si todos los valores propios de

A tienen partes reales no-positivas y aquellos con partes reales cero son ceros simples del polinomio
mnimo de

A.

2.- Todas las soluciones de la Ecuacin (3.2) tienden a cero cuando


valores propios de

t si y solo si, todos los

A tienen partes reales negativas.


28

Nos referiremos a matrices que satisfacen la condicin 1 como matrices estables y aquellas que
satisfacen la condicin 2 como matrices asintticamente estables.
Los valores propios de

A puede ser determinados como las races de la ecuacin

caracterstica

g ( )
Si las raices de

det [ I A ] = 0 .

g ( ) permanecen en

g ( ) decimos que es un polinomio de Hurwitz y las

soluciones de la Ecuacin (3.2) tienden a cero. Si las races satisfacen la condicin 1 en el Teorema
3.f.2 , g

( )

se dice que es un polinomio estable. Estas condiciones pueden revisarse usando el

criterio Routh-Hurwitz obtenido hace cien aos. Esto muestra la importancia de los resultados de Routh
y Hurwitz en la teora de estabilidad de sistemas lineales invariantes. Ya que en general la matriz de
transicin

( t , t 0 ) de sistemas lineales de tiempo variante no puede ser expresada directamente

en trminos de la matriz

A ( t ) , no hay condiciones algebraicas similares conocidas para sistemas de

tiempo-variante.

4. ESTABILIDAD EN SISTEMAS NO-LINEALES


Y basados en la conviccin de que los sistemas adaptativos slo pueden ser diseados con
confianza cuando sus propiedades de estabilidad global son bien entendidas.
Kumpati S. Narendra

4.a. Anlisis por linealizacin


En el estudio de los sistemas dinmicos, la primera propiedad que es necesario conocer del
sistema es cuando es estable, bajo que condiciones y cerca de que puntos de operacin. Por otra
parte para hacer posible la descripcin de un sistema hay que simplificarlo, tomando solamente los
factores ms significativos. Adems las ecuaciones raramente se pueden resolver en forma cerrada,
sino que se suelen resolver de forma aproximada. Es importante el estudio de si las variaciones
pequeas en las condiciones iniciales hacen que cambien mucho el comportamiento del sistema.
Consideremos el sistema

x = f1 ( x, y )
..(4.a.1)

y = f 2 ( x, y )
Los puntos de equilibrio del sistema son las soluciones del sistema f1 ( x, y ) = f 2 ( x, y ) = 0 . Los sistemas
lineales pueden tener a lo sumo un punto singular (salvo los casos degenerados). Puesto que siempre

29

se puede hacer una traslacin del sistema de coordenadas del plano fase, podemos considerar que
el punto singular est en el origen.
Cuando el sistema es no-lineal se pueden linealizar las ecuaciones (4.a.1) en torno al origen
para poder aproximar el sistema por uno lineal y clasificar los posibles puntos singulares. Supongamos
que el sistema lineal viene dado por las siguientes ecuaciones.

x = ax + by

y = cx + dy
de manera matricial

x1 a b x
=
.
x2 c d y

La ecuacin caracterstica del sistema linealizado es

D ( ) =
llamando

a
c

a b

I A = 0 , donde A =
es
c d

b
= 2 ( a + b ) + ad bc = 0
d

p = (a + d ), q = ad bc , se tiene D ( ) = 2 + p + q = 0
Las races de esta ecuacin son los valores propios:

1 , 2 =

p p 2 4q
2

El tipo de punto singular del sistema lineal, depende de cmo son los valores propios del sistema.
La solucin de x = Ax para un estado inicial x0 es:

x ( t ) = P exp ( Jt ) P 1 x0
donde J es la forma cannica de Jordan de A y P es una matriz no singular de paso, tal que

A = P 1 AP . Segn los valores propios de A , la forma de Jordan puede tomar una de las siguientes
formas:

1 0 k

,
, y
0 2 0

donde k puede ser 0 o 1. La primera forma corresponde al caso de valores propios reales y distintos,
la segunda forma corresponde al caso de valores propios reales e iguales y la tercera forma
corresponde al caso de valores propios complejos

1,2 j .

1. Si q < 0 , los valores propios son reales y de signo distinto. El punto singular se denomina punto silla.

30

x'

x
x

Punto silla

2. Si los valores propios

son reales y negativos las soluciones son exponenciales decrecientes. Las

trayectorias en el plano de fases convergen hacia el origen y el punto singular se denomina nodo
estable.

x'

x
x

Nodo estable
3. Si los valores propios

son complejos conjugados con parte real negativa, las trayectorias son

sinusoides compuestas con trminos exponenciales decrecientes en forma de espirales que se van
aproximando al origen. El punto singular se denomina foco estable.

x'

x
x

Foco estable

31

4. Si los valores propios son reales y positivos los modos son exponenciales crecientes y las
trayectorias se alejan del origen. El punto singular se denomina nodo inestable.
j

x'

x
x

Nodo inestable
5. Si los valores propios son complejos conjugados con parte real positiva, los modos son sinusoides
compuestas con trminos exponenciales crecientes y las trayectorias en el plano de fases son
espirales que se van alejando del origen. El punto singular se denomina foco inestable.
j

x'
x

Foco inestable
6. Si los valores propios son imaginarios puros, los modos son sinusoides y las trayectorias en el plano
fase son circunferencias con centro en el origen. El punto singular se denomina centro.
j

x'

Centro
7. Si uno de los valores propios es cero, el plano de fase es degenerado. La matriz A tiene un
subespacio nulo (kernel) no nulo y cualquier vector del subespacio nulo ser un punto de
equilibrio, es decir, el sistema tiene un subespacio de equilibrio de dimensin uno, en vez de un
punto de equilibrio.
32

8. Si ambos valores propios son cero la matriz A es la matriz cero y el subespacio nulo es de
dimensin dos, es decir todos los puntos del plano son puntos de equilibrio. En este caso las
trayectorias estn formadas por un punto.

4.b. Anlisis de la estabilidad por el mtodo de Lyapunov


4.b.1. Definiciones y teoremas en el Mtodo Directo
El mtodo de Lyapunov est pensado para sistemas modelados en variables de estado. Un
punto de equilibrio o punto crtico es un punto en el que x es cero en ausencia de entradas y
perturbaciones. Por tanto si el sistema es puesto en ese estado permanece indefinidamente en l, y es
un punto de equilibrio. Un punto crtico es estable cuando las trayectorias que nacen en puntos
prximos al punto de equilibrio, permanecen uniformemente prximas a dicho punto en los tiempos
posteriores.
Si se produce una pequea perturbacin, el sistema puede volver al punto de partida y se dice
que es estable. El sistema puede alejarse de ese punto y el punto se llama inestable. Si el sistema no se
acerca ni se aleja, el punto se llama neutralmente estable.
En el mtodo de Lyapunov se consideran sistemas del tipo

x = f ( x, t )
donde
de

x es el vector de estado de dimensin n y f es una funcin lineal o no-lineal que depende

x y de t . Tienen especial inters los sistemas denominados autnomos o sistemas que no varan

en el tiempo.

x = f ( x)
Para todos estos tipos de sistemas el punto de equilibrio se considera el origen, ya que haciendo el
cambio de variables xi = xi ci se consigue trasladar el punto de equilibrio al origen. Asimismo, se
supone que no hay otra solucin constante en el entorno del origen, por tanto, es un punto de
equilibrio aislado.
La Estabilidad de Lyapunov considera la estabilidad como una propiedad interna del sistema, y
trata con el efecto de perturbaciones en las condiciones iniciales. Primero debemos asegurarnos la
existencia de soluciones para todas las condiciones iniciales

( x0 , t0 )

donde

x0

t0

Sea un sistema descrito por la ecuacin diferencial no-lineal

x= f

( x, t )

f ( 0, t ) = 0, t t 0

.. (4.b.1)

33

x (t0 ) = x0 y f :

donde
que

es tal que la solucin

x ( t ; x 0 , t 0 ) existe para toda t t 0 . Ya

f ( 0, t ) 0 , esto implica que el origen es un estado de equilibrio. Las siguientes definiciones

pertinentes para algunas de nociones bsicas en estabilidad de Lyapunov en tal estado de equilibrio.
Definicin L.1 Estado de equilibrio estable
El estado de equilibrio x = 0 de la ecuacin (4.b.1) se dice que es estable si para cada
y

>0

t 0 0 , existe un ( , t 0 ) > 0 tal que x0 < implica que x ( t ; x0 , t0 ) < , t t0 (Ver figura

4.1.a)

Esencialmente la Definicin L.1 establece que resultan pequeas perturbaciones en pequeas


desviaciones del estado de equilibrio o mas precisamente que podemos mantener la trayectoria
cercana al origen por empezar suficientemente cercana a este.
Definicin L.2 Estado de equilibrio atractor
El estado de equilibrio x = 0 de la Ecuacin (4.b.1) se dice que es atractor si para algn

t 0 > 0 existe un nmero T ( , x0 , t0 ) tal que x0 < implica que x ( t ; x0 , t0 ) < para

cada

toda

t t0 + T .

>0

Atractividad implica que todas las trayectorias que empiezan en una vecindad del origen
eventualmente se aproximan al origen. Si el vector inicial x0 tiene una norma menos que

, entonces

para todo tiempo t mas grande que t0 + T , la trayectoria esta a menos de una distancia

lejos del

origen. Uno puede estar tentado a concluir que un sistema atractor debe ser estable tambin. Pero
atractividad y estabilidad muestran ser conceptos diferentes. Por ejemplo un sistema autnomo
puede ser atractor pero inestable.
Definicin L.3 Asintticamente estable
El estado de equilibrio x = 0 de la ecuacin diferencial (4.b.1) se dice ser asintticamente estable si
es estable y atractor (ver figura c).
En este caso la trayectoria tiende a el origen cuando t y al mismo tiempo permanece cerca del
origen si empieza suficientemente cercano a este.
Las propiedades de estabilidad de muchos sistemas no dependen del tiempo inicial t0 .
Sistemas autnomos y algunos peridicos son ejemplos tpicos. Esto motiva las definiciones de
estabilidad uniforme y estabilidad asinttica uniforme.
34

Definicin L.4 Uniformemente estable


El estado de equilibrio x = 0 de la ecuacin diferencial (4.b.1) se dice ser uniformemente estable si
en la Definicin L.1,

es independiente del tiempo inicial t0 ( ver figura d).

Definicin L.5 Uniformemente asintticamente Estable


El estado de equilibrio

x = 0 de la ecuacin (4.b.1) es uniformemente asintticamente estable

(U.A.S.), si es estable uniformemente para algn

1 > 0

y para cada

2 > 0

existe T ( 1 , 2 ) > 0 tal

que si x0 < 1 , entonces x ( t ; x0 , t0 ) < 2 para toda t t0 + T ( ver figura e).

La importancia de la estabilidad asinttica y uniforme en el anlisis de los sistemas dinmicos se


volver clara en las siguientes secciones.
Definicin L.6 Exponencialmente estable
El estado de equilibrio

x = 0 de la ecuacin (4.b.1) es exponencialmente estable

constantes a > 0 y b > 0 tales que


vecindad

x ( t ; x0 , t0 ) a e(

b ( t t0 ) )

si existen

x0 , t t0 para toda t0 y en una

B del origen.

Definicin L.7 Estabilidad en el sentido de Lyapunov


El punto de equilibrio

x = 0 se denomina estable si para todo >0, existe > 0 tal que si

entonces x ( t ) < para todo

x (0) <

t > 0 . En caso contrario el punto de equilibrio es inestable (ver figuras

a y b).

Definicin L.8 Estabilidad asinttica


El punto de equilibrio 0 es asintticamente estable si es estable y adems existe

>0

tal que si

x ( 0 ) < , entonces x ( t ) 0 cuando t

35

esfera de radio

esfera de radio

esfera de radio

esfera de radio

x(0)

x(0)

a) Punto de equilibrio estable

b) Punto de equilibrio inestable

esfera de radio
x(0)

esfera de radio

c) Punto de equilibrio Estable Asintticamente

x(0)

esfera de radio

esfera de radio 2

esfera de radio

d) Punto de equilibrio Estable


Uniformemente

x(0)

esfera de radio 1

e) Punto de equilibrio Estable Asintticamente


y Uniformemente

figura 4.1
36

Una funcin

L ( x ) es definida negativa (positiva) en un entorno S ( 0 ) del origen si L ( x ) < 0

( L ( x ) > 0) ,

x S ( 0 ) con x 0 , y L ( 0 ) = 0 . La funcin L ( x ) es semidefinida negativa (positiva)

en un entorno

S ( 0 ) del origen si L ( x ) 0

( L ( x ) 0) ,

x S ( 0 ) con x 0 , y L ( 0 ) = 0 .

Estabilidad asinttica implica que la solucin tiende al equilibrio cuando t y estabilidad


asinttica uniforme implica que la convergencia de la solucin es independiente del tiempo inicial. Si

lim ( ) = en las definiciones dadas, entonces se dice que la estabilidad se mantiene en lo


amplio o que el estado de equilibrio es globalmente estable. Si la Definicin L.5 se mantiene para
cada

1 > 0 ,

en la ecuacin (4.b.1) se dice que el estado de equilibrio es global, asintticamente y

uniformemente estable (U.A.G.S.). Estabilidad exponencial de un sistema implica siempre estabilidad


asinttica uniforme. Lo inverso en general no es cierto. En el caso de sistemas lineales, sin embargo,
estabilidad asinttica uniforme es equivalente a exponencialmente estable. Tambin se mantienen
todas las propiedades de globalmente estable para sistemas lineales. Si el sistema es autnomo todas
las propiedades de estabilidad son uniformes. Si B =

en la Definicin L.6 entonces el estado de

equilibrio es exponencialmente y globalmente estable.


El mtodo directo de Lyapunov es capaz de determinar la estabiliad de un punto equilibrio. sin
la determinacin explcita de la solucin de la Ecuacin (4.b.1). El mtodo ha probado ser efectivo en
el anlisis de estabilidad de ecuaciones diferenciales no-lineales cuyas soluciones son generalmente
muy difciles de determinar. Esto involucra encontrar una adecuada funcin escalar L( x, t ) y

examinar su derivada respecto del tiempo L( x0 , t ) =

d
a lo largo de las trayectorias
L( x (t , x0 ), t )
dt
t =0

del sistema. El razonamiento detrs de este mtodo es que en un sistema puramente disipativo, la
energa almacenada en el sistema es siempre positiva y cuya derivada de tiempo es no-positiva. En
teora de estabilidad, los teoremas de Lyapunov para estabilidad estn establecidos separadamente
en sistemas autnomos y no-autnomos y son establecidas restricciones sobre las funciones

L ( x, t ) y

L( x, t ) para asegurar las distintas clases de estabilidad definidas anteriormente.


Teorema 4.b.(I) Estabilidad uniforme y global; sistema autnomo
Sea un sistema autnomo el descrito por la ecuacin

x = f ( x ) , . (4.b.2)

37

donde f ( 0 ) = 0 . El punto de equilibrio x = 0 es asinttica uniforme y globalmente estable si existe


una funcin escalar L ( x ) con la derivada parcial continua con respecto a x , tal que L ( 0 ) = 0 , y (i)

L ( x ) > 0 para toda x 0 , (ii) L ( x ) < 0 para toda x 0 , y (iii) L ( x ) cuando x .


Teorema 4.b.(II) Estabilidad Asinttica Uniforme y Global
Sea un sistema el descrito por la ecuacin

f ( 0, t ) = 0, t t 0 . (4.b.1)

x = f ( x, t )

El estado de equilibrio de la ecuacin (4.b.1) es estable asintticamente, uniformemente y


globalmente si existe una funcin escalar

L ( x , t ) con primeras derivadas parciales continuas con

respecto a x y a t tal que L(0, t ) = 0 y si las siguientes condiciones son satisfechas:

L( x, t ) es definida positiva, esto es, existe una funcin escalar no decreciente continua tal

(i)

que

( 0) = 0

y L ( x, t )

( x ) > 0 , para toda t y toda x 0;

(ii) L( x, t ) es decreciente, esto es, existe una funcin escalar no decreciente continua

( 0) = 0

( x ) L ( x, t )

tal que

para toda t ;

L( x, t ) es definida negativa, esto es,

(iii)

L( x , t ) =
Donde

L
T
+ ( L ) f ( x, t ) ( x ) < 0
t

es una funcin escalar no decreciente continua con

( 0 ) = 0 , L

es el gradiente de

L con respecto a x , y la derivada de tiempo de L es avaluada a lo largo de la trayectoria de


la ecuacin diferencial (4.b.1).

L( x, t ) es no acotada radialmente, esto es, ( x ) cuando x .

(iv)

Demostracin
Una idea general de la demostracin esta dada en dos estados:
1.

Estabilidad Uniforme

De (i) y de (ii) tenemos,


Para cualquier

> 0,

( x ) L ( x, t ) ( x
existe una

>0

tal que

( ) < ( ) .

Sean las condiciones iniciales

escogidas de tal manera que x0 < . Entonces


38

( ) > ( ) L ( x0 , t0 )
L ( x ( t ; x0 , t0 ) , t )
ya que L ( x, t ) 0 por la condicin (iii), por lo tanto

( ) ( x ( t; x0 , t0 )
Ya que

).

( ) es no decreciente, esto implica que

x ( t ; x0 , t0 ) <

t t0 , y por lo tanto, el

origen de la ecuacin (4.b.1) es Estable Uniformemente. ( ver grfico 1 )


2.

Estabilidad Asintticamente Uniforme

Para establecer la estabilidad asinttica uniforme, se necesita mostrar que dado cualquier

2 ,

existe un T ( 1 , 2 ) > 0 tal que

x0 < 1 x ( t ) < 2
Sea

tales que

( ) < ( 1 )

toda t t0 . Si escogemos

2 <

algn tiempo t = t0 + T , entonces

t t0 + T
y, por lo tanto, por (1), si x0 < , entonces x ( t ; x0 , t0 ) < 1 para
y

> 0 tal

que

( ) < ( 2 ) ,

entonces si

x ( t ; x0 , t0 ) < 2 para toda t t0 + T . La existencia de tal T se

muestra para contradiccin. Sea x ( t ) estar en un intervalo compacto


funcin continua

( x

x ( t ; x0 , t0 ) < para

[ , 1 ]

para toda t t0 . La

) de la condicin (iii) del Teorema 4.b.1 asume un valor mnimo

intervalo compacto. Definiendo T =

( )
0

> 0 en este

, entonces existe un tiempo t2 = t0 + T en el cual

0 < ( ) L ( x ( t2 ; x0 , t0 ) , t2 )
L ( x0 , t0 ) T 0
( ) ( ) = 0 , lo cual es una contradiccin. Por lo tanto el origen de
la ecuacin (4.b.1) es UAS estable asintticamente y uniformemente. Ya que por la condicin (iv),

( ) es no acotada radialmente, una puede ser encontrada tal que ( ) < ( ) para
cualquier

. En suma,

puede hacerse arbitrariamente grande. Por lo tanto, x = 0 en la ecuacin

(4.b.1) es Estable Asintticamente, Uniformemente y Globalmente. (ver grafico 1)


Si L( x, t ) 0 y la condicin (i) es satisfecha, el origen de la ecuacin (4.b.1) es Estable; si en
adicin a esto la condicin (ii) es satisfecha, se desprende Estabilidad Uniforme y L ( x, t ) es referida
como Funcin de Lyapunov.
39

b(IIxII)

L(x,t)
a(IIxII)
a(e)
b(d)

a(e2)
b(n)
0

e2 d

e=e1 IIxII

Estabilidad Uniforme y Estabilidad Asinttica Uniforme


Grafico 1
Comentario
En las definiciones de estabilidad anteriores se ha asumido tcitamente que las soluciones de las
ecuaciones diferenciales para unas condiciones iniciales dadas pueden ser extendidas para todo

t t0 . Una condicin suficiente para esto es que f ( x, t ) satisfaga una condicin de Lipschitz, esto es,
existe una constante k tal que:
Para toda ( x1 , t ) , ( x2 , t ) en
vez de esto asumimos que

f ( x1 , t ) f ( x2 , t ) k x1 x2

M . Sin embargo en muchos casos esto no puede ser verificado. En

f F as que la solucin existe en un intervalo [t0 1 , t0 + 1 ] alrededor

de t0 y se usa la existencia de una funcin de Lyapunov para asegurar que x ( t ; x0 , t0 ) pertenece a


un conjunto compacto. Esto asegura que la solucin puede ser extendida para toda t t0 .
Sin perder generalidad, no hay una regla explcita para encontrar la funcin de Lyapunov que
satisfaga las condiciones del Teorema 4.b.(I) excepto en el caso de sistemas LTI . Si el origen de la
Ecuacin (4.b.1) es UAS . un importante Teorema de Massera nos asegura la existencia de la funcin
de Lyapunov.
Hay teoremas que aseguran la existencia de funciones de Lyapunov para sistemas lineales.
Esto, por consiguiente, puede ser modificado adecuadamente para aplicar a clases especficas de
sistemas no-lineales.
Con condiciones

L ( x, t ) > 0, L ( x, t ) 0
40

La condicin (ii) en el Teorema 4.b.a, requiere que L ( x, t ) sea evaluada a lo largo de cualquier
trayectoria que sea negativa-definida, esto es particularmente riguroso de satisfacer. En la prctica es
a menudo considerablemente mas simple construir una funcin de Lyapunov L ( x, t ) con una
derivada de tiempo semidefinida-negativa que una que sea definida-negativa. Mas relevante para
nuestros propsitos es el hecho que la condicion (ii) puede no ser nunca satisfecha para todo el
espacio de estado para sistemas adaptativos. Por lo tanto, lo mejor que uno puede esperar es hacer

L ( x, t ) semidefinida-negativa. Uno de los problemas fundamentales en el anlisis de estabilidad de


sistemas adaptativos consecuentemente es la determinacin del funcionamiento asinttico de las
soluciones de ecuaciones diferenciales gobernado el sistema por un conocimiento de la funcin de
Lyapunov L ( x, t ) cuya derivada de tiempo es semidefinida-negativa.
El problema descrito ha sido discutido con gran amplitud en la literatura de estabilidad, y para
ciertas clases de sistemas LaSalle ha demostrado que la estabilidad asinttica uniforme puede ser
concluida.
La Estabilidad Asinttica es una propiedad fuerte que es muy difcil de alcanzar en la prctica
en sistemas dinmicos. Sin embargo, se tienen algunas definiciones suaves que son ms tiles.
Teorema 4.b.(III) Uniformemente SISL
Un punto de equilibrio
un

( , t0 ) > 0

xe es estable en el sentido de Lyapunov ( SISL) en t0 . Si para cada > 0 existe

tal que x ( t0 ) xe <

( , t0 )

implica que x ( t ) xe < para t t0 . La estabilidad se

dice que es uniforme ( es decir, uniformemente SISL ). Si

( )

es independientes de t0 . Esto es, el

sistema es SISL para todo t0 .


Hay que notar que SISL
arbitrariamente a

requiere la habilidad de guardar el estado

x ( t ) cercano

xe por empezar suficientemente cercano a este. Este an es un requerimiento muy

fuerte para el anlisis de de estabilidad de sistemas prcticos en presencia de perturbaciones. Sin


embargo lo vamos a resolver en la siguiente definicin.
Esta definicin esta relacionada con el Grafico 2 siguiente.
Teorema 4.b.(IV) Acotado Uniformemente y Ultimamente
El punto de equilibrio

xe es acotado uniformemente y ltimamente ( UUB ) si existe un conjunto

compacto S R tal que para cada x ( t0 ) S existe un rango acotado


n

B y un tiempo T ( B, x ( t0 ) )

tal que x ( t ) xe < B para todo t t0 + T .

41

El intento aqu es capturar la nocin que para todos los estados iniciales en el conjunto compacto S ,
la trayectoria del sistema eventualmente alcanza despus de un tiempo T una vecindad acotada de

xe .

Acotamiento B

xe+B
x(t)

xe
xe-B

t0
t0+T

T
ACOTAMIENTO UNIFORME Y ULTIMO

Grafico 2

La diferencia entre Acotamiento Uniforme y Ultimo UUB y SISL es que el acotamiento


hacerse arbitrariamente pequeo por empezar cercano a

B no puede

xe . En sistemas prcticos, en acotamiento

B depende de perturbaciones y otros factores. Sin embargo un buen diseo de controlador debe
garantizar que

B sea bastante pequeo. El trmino uniforme indica que B no depende de t0 . El

trmino uniforme indica que el acotamiento se mantiene despus de un cierto lapso T . Si

S=

, el

sistema se dice que es globalmente UUB , es decir GUUB .


Hay que notar que si la funcin f ( ) en (4.b.1) no depende explcitamente del tiempo t la
estabilidad o acotamiento siempre se mantiene uniforme. La no-uniformidad slo es problema con
problemas que dependen del tiempo.
Los sistemas industriales son generalmente no-lineales, un problema que es exacerbado por la
presencia de no-linealidades del actuador tales como friccin, zonas muertas y backlash. Las estrictas
tolerancias modernas en la fabricacin de semiconductores de integracin a gran escala, el
maquinado de alta precisin de partes para sistemas aeroespaciales y otros campos ponen severos
42

requerimientos en posicionamiento, velocidad y precisin de sistemas industriales mecnicos. El


diseo de sistemas de control para sistemas no-lineales no es fcil.

Teorema

de

Estabilidad

de

Lyapunov.
La funcin de Lyapunov es una funcin de la energa generalizada. El siguiente resultado
importante muestra que pude ser usada para analizar estabilidad del sistema (2.1.9). Ahora veremos
como usar este resultado para disear sistemas de control.
Teorema 4.b.(V) Estable en el Sentido de Lyapunov
Si existe una funcin de Lyapunov para el sistema (4.b.1), entonces el punto de equilibrio es SISL .
El siguiente teorema proporciona un fuerte resultado si la derivada de Lyapunov es negativa
definida.
Teorema 4.b(VI) Estabilidad de Asinttica
Si existe una funcin de Lyapunov para el sistema (4.b.1) con el fortalecimiento de la condicin

L ( x ) < 0 para toda x ( t ) diferente de cero, entonces el punto de equilibrio es AS .


Si la derivada de la funcin de Lyapunov es definida negativa entonces el sistema es GAS . Si la
derivada de la funcin de Lyapunov es semidefinida negativa entonces el sistema es slo SISL ; esto
es, el estado interno es acotado pero no va a cero con el tiempo.

4.b.2. Ejemplos del Mtodo Directo


Para tener una matriz de una funcin de Lyapunov, en las formas cuadrticas se puede aplicar el
criterio de Silvester, que dice que la condicin necesaria y suficiente para que la forma cuadrtica

a11

a
L ( x ) = ( x1 , x2 ,..., xn ) 21

an1

a12
a22
an 2

a1n x1

a2 n x2


ann xn

(donde la matriz en real y simtrica ), sea definida positiva es que sus menores principales sean
positivos:

a11 > 0,

a11

a12

a21

a22

> 0, ,

a11

a12

a1n

a21

a22

a2 n

an1

an 2

ann

>0.

L ( x ) es definida negativa si

43

a11 < 0,

a11

a12

a21 a22

> 0, , ( 1)

a11

a12

a1n

a21

a22

a2 n

an1

an 2

ann

>0

L ( x ) es semidefinida positiva si la matriz es singular y todos sus menores principales son no negativos.
L ( x ) es semidefinida negativa si ( 1) i (det. principal de orden k ) 0
k

Ejemplos:

L ( x ) = x12 + x22 es definida positiva ( x 0, L ( x ) > 0, L ( 0 ) = 0 )

L ( x ) = ( x1 + x2 ) es semidefinida positiva
2

( con

x1 = x2 0 L ( x ) = 0)

44

L ( x ) = x12 ( x1 + x2 )

es definida negativa x 0, L ( x ) < 0, L ( 0 ) = 0

L ( x ) = x1 x2 + x22 es indefinida

Ejemplo 1
Estudiar la estabilidad del sistema

x1 = x2 x1 ( x12 + x22 )
x2 = x1 x2 ( x12 + x22 )
Se encuentran los puntos de equilibrio

0 = x2 x1 ( x12 + x22 )
0 = x1 x2 ( x12 + x22 )

x=0

0 = x22 x1 x2 ( x12 + x22 )


0 = + x12 + x1 x2 ( x12 + x22 )

Por lo cual, 0 = x1 + x2 y sustituyendo en el primer sistema queda


2

45

x1 = 0
x2 = 0
Es decir el nico punto de equilibrio es el origen
Considerando la funcin de Lyapunov

L ( x ) = x12 + x22 , que es definida positiva

Ahora se verificar si su derivada considerando las ecuaciones del sistema es definida negativa

L ( x ) = 2 x1 x1 + 2 x2 x2

= 2 x1 x2 x1 ( x12 + x22 ) + 2 x2 x1 x2 ( x12 + x22 )


Es decir,

L ( x ) = 2 ( x12 + x22 )

es definida negativa. Por lo tanto, el sistema es asintticamente

L ( x ) = x12 + x22 , cuando

estable. Como se verifica que

x 2 = x12 + x22 , entonces el

sistema es global y asintticamente estable.


Ejemplo 2
Estudiar la estabilidad del sistema

x1 = x1 x22 x1
x2 = x12 x2
Considerando la funcin de Lyapunov

L ( x) =

1 2
( x1 + x22 ) , que es definida positiva. Ahora se
2

verificar si su derivada es definida negativa:

L( x) = x1 ( x1 x22 x1 ) + x2 ( x12 x2 )
L ( x ) = x12
Es slo semidefinida negativa ya que puede ser cero cuando

x2 0 . Por lo tanto es sistema es slo

SISL, esto es, el estado interno es acotado pero no va a cero con el tiempo.
Ejemplo 3
Estudiar la estabilidad del sistema

x1 = x2 + x1 ( x12 + x22 )
x2 = x1 + x2 ( x12 + x22 )
Si se linealiza el sistema en el origen, se obtiene

x1
= 3x12 + x22
x1
x2
= 1 + 2 x1 x2
x1

( 0,0 ) = 0

x1
= 1 + 2 x1 x2
x2

( 0,0 ) = 1

( 0,0) =

x2
= x12 + 3 x2
x2

( 0,0 ) = 0

46

es decir

x1 0 1 x1
=
y por tanto el origen es un centro. Si tomamos como funcin de
x2 1 0 x2

Lyapunov

L ( x ) = x12 + x22 , como su derivada es:


L ( x ) = 2 x1 x1 + 2 x2 x2

= 2 x1 x2 + x1 ( x12 + x22 ) + 2 x2 x1 + x2 ( x12 + x22 )

= 2 x14 + 4 x12 x22 + 2 x24


se obtiene que

L ( x ) y L ( x ) son definidas positivas lo cual nos dice el teorema que el sistema es

inestable.
El criterio de Lyapunov es aplicable a sistemas no-lineales, pero su verificacin, en general, no es
nada fcil. Puede ser que no se encuentre una funcin de Lyapunov, pero esto no indica que dicha
funcin no exista.

4.b.3. Extensin de Lyapunov. Lema de Barbalat


En algunas situaciones, los teoremas anteriores proporcionan muy poca informacin y sin embargo
llegan a pedir mucho de los sistemas industriales y de defensa que tengan perturbaciones y
deficiencias de actuadores. Algunas extensiones de la teora de Lyapunov estn dirigidas a resultados
prcticos que puedan ser usados en los actuales sistemas de control industrial.
El primer resultado est basado en el Lema de Barbalat.
Dado un subconjunto S R , una funcin f ( x ) : S R
n

para cada
Si

( )

>0

existe un

( e, x0 ) > 0

es continua en S si para cada x0 S y

tal que x x0 < ( e, x0 ) implica que

f ( x ) f ( x0 ) < .

es independiente de x0 entonces se dice que f ( x ) es uniformemente continua. Continuidad

uniforme a menudo es difcil de probar. Sin embargo, si f ( x ) es continua y su derivada

f
es
x

acotada entonces f ( x ) es continua uniformemente. Esta prueba es slo suficiente pero es fcil de
usar.
Teorema 4.b.(VII) Lema de Barbalat, Extensin de Lyapunov
Sea L ( x ) una funcin de Lyapunov. Si L ( x ) es continua uniformemente, entonces L ( x ) 0
cuando t .
Este teorema permite obtener mas informacin acerca del funcionamiento del sistema que la
proporcionada por el Teorema 4.b.(V). Se dice que si L ( x ) tiene una propiedad extra, entonces uno
47

puede concluir que L ( x ) 0 . Esto puede decirnos a menudo que ciertos estados en el sistema no
son simplemente acotados ya que en realidad van a cero. Para verificar la continuidad uniforme de

L ( x ) , slo es necesario revisar que L ( x ) est acotada.


Ejemplo 1 ( Estabilidad Asinttica de los componentes del estado usando el lema de Barbalat )
Consideremos el sistema

x1 = x1 x22 x1
x2 = x12 x2
Con una funcin de Lyapunov candidata

L ( x) =

1 2
x1 + x22 ) , la cual tiene
(
2

L ( x ) = x12
Ya que esta es semidefinida negativa, podemos concluir que el sistema es SISL . Usando el Lema de
Barbalat, podemos extraer mas informacin acerca de la estabilidad de esta funcin de Lyapunov.
En efecto

L ( x ) = 2 x1 x1 = 2 x12 x22 + 2 x12


El anlisis de Lyapunov muestra SISL . Lo cual muestra que x est acotada. Esto a su vez muestra
que L ( x ) est acotada, de aqu que L ( x ) es continua uniformemente. Por lo tanto L ( x ) en
realidad va a cero. Esto finalmente demuestra que x1 ( t ) 0 . As la extensin de Barbalat ha
permitido probar que ciertos componentes del estado son Estables Asintticamente AS .
Los siguientes resultados proporcionan una forma ms leve de estabilidad que SISL , que es
mas til para el diseo de controladores en sistemas prcticos, los cuales normalmente tienen la
forma

x = f ( x ) + d ( t ) .( 4.b.3 )
Con d ( t ) una perturbacin desconocida pero acotada. El teorema dice cuando el acotamiento
uniforme y ltimo est garantizado.
Teorema 4.b.(VIII) Acotamiento Uniforme y Ultimo por Extensin de Lyapunov
Se supone que para el sistema (4.b.3 ) existe una funcin L ( x ) con derivadas parciales continuas
tales que para x en un conjunto compacto S R .
n

L ( x ) es definida positiva.
L ( x ) es definida negativa para x > R

48

Para algn R > 0 tal que la bola de radio R es contenida en S . Entonces el sistema es Acotada
Uniformemente y ltimamente UUB y mas an,
radio

x (t ) es acotada en una vecindad de la bola de

R.

Ejemplo 2 ( UUB Extensin de Lyapunov).


Considerar el sistema

x1 = x1 x22 x1 ( x12 + x22 2 )


x2 = x12 x2 x2 ( x12 + x22 2 )
Y seleccionando una candidata a funcin de Lyapunov L ( x ) =

1 2
( x1 + x22 ) . Esta tiene la derivada
2

L ( x ) = ( x12 + x22 )( x12 + x22 2 )


La cual es negativa siempre que

x = x12 + x22 > 2


2

Las tcnicas normales de Lyapunov fallan aqu ya que L ( x ) ni siquiera es semidefinida negativa. Sin
embargo, la extensin UUB muestra que el sistema es UUB con el estado restringido a la vecindad
de una bola con radio x = 2 .

4.c. Anlisis Estabilidad Total y BIBO (entradas acotadas-salidas acotadas)


Es de gran inters la estabilidad global de los sistemas adaptativos y la principal aproximacin usada
para asegurar esto es el mtodo directo de Lyapunov. En muchas situaciones, sin embargo, el
mtodo de Lyapunov no puede ser usado exclusivamente y uno tiene que usar otros conceptos que
han sido tratados extensivamente en la literatura de estabilidad. Esto incluye la estabilidad BIBO la
cual es mas apropiada cuando estn presentes perturbaciones externas continuas y Estabilidad Total
cuando las perturbaciones pueden ser consideradas ser dependientes del estado.
Cuando las perturbaciones externas e internas estn presentes en el sistema, las ecuaciones
para analizar tienen la siguiente forma no-lineal:

x ( t ) = f ( x, t )

f ( 0, t ) = 0

x ( t ) = f ( x, t ) + g ( x, t )

t t0

(S )

.. (4.c.1)(a)

( S p ) . (4.c.1)(b)

donde ( S ) representa un sistema no perturbado con x = 0 como el estado de equilibrio, y ( S p )


es un sistema perturbado g ( x, t ) el cual puede deberse a no-linealidades, variaciones de parmetros
perturbaciones estructurales.
49

Definicin 4.c.I
El estado de equilibrio x = 0 de
positivos

1 ( )

( S ) es totalmente estable si para cada > 0 , existen dos nmeros

2 ( ) tales que x ( t0 ) < 1

y g ( x, t ) < 2 implican que cada solucin x ( t ; x0 , t0 )

de ( S p ) , satisface la condicin x (t ; x0 , t0 <

El siguiente teorema indica la relacin entre estabilidad total y estabilidad asinttica uniforme en el
sentido de Lyapunov.
Teorema 4.c.a
Si el estado de equilibrio de

( S ) es estable asintticamente y uniformemente, entonces este es

totalmente estable.

Del Teorema

4.c.a, se desprende para perturbaciones pequeas suficientemente y condiciones

iniciales que son, u 2 y x0 1 donde

1 , 2

son pequeas suficientemente, las soluciones de la

ecuacin diferencial no-lineal

x = f ( x, t ) + u ( t )

x ( t0 ) = x0

(4.c.2)

Sern acotadas uniformemente para toda t t0 . Sin embargo, en la prctica, es de gran inters
determinar la naturaleza de las soluciones, cuando algn margen es especificados sobre u .
La estabilidad BIBO (entradas acotadas salidas acotadas ) es considerablemente mas difcil
de establecer en sistemas no-lineales de la forma de la Ecuacin (4.c.2) que en sistemas lineales,
donde tal estabilidad continua si el sistema no-forzado es UASG (o estable exponencialmente). Sin
embargo, los anlisis de sistemas adaptativos en la presencia de perturbaciones dirige
invariablemente los cuestionamientos relacionados a Estabilidad BIBO .

Teorema 4.c.b
Considerar la ecuacin diferencial

x = f ( x)

x : R + R n . (4.c.3)

Sea una vecindad del origen acotada y sea su complemento. Se supone que L ( x ) es una
c

funcin escalar con derivadas parciales continuas en y satisface 1) L ( x ) > 0, x , 2)


c

L ( x ) 0, x c y 3) L ( x ) cuando x . Entonces cada solucin de la Ecuacin (4.c.3)


esta acotada para toda t 0 .

50

5. CONTROL DE SISTEMAS ADAPTATIVOS


5.a. Problema de Identificacin: caso escalar
El mtodo directo de Lyapunov es la herramienta principal usada para la derivacin de las leyes
adaptativas estables. Este mtodo puede ser usado para disear sistemticamente una amplia clase
de sistemas adaptativos estables. En los casos considerados la estabilidad global es asegurada por la
existencia de una funcin de Lyapunov para el sistema entero, elegir las funciones necesarias es
crucial para una adecuada ley adaptativa.
Consideremos el problema de Identificacin de la dinmica de una planta con una entrada
acotada u y una salida x p descrita por una ecuacin diferencial de primer orden:

x p ( t ) = a p x p (t ) + k pu (t )
donde los parmetros a p y k p son constantes pero son desconocidas. El estado de equilibrio de la
planta no-forzada se asume que es estable asintticamente as que a p < 0 . El problema de
identificacin entonces se reduce a la determinacin de a p y k p del par observado u ( t ) y x p ( t ) de
entrada-salida.
Para realizar esto describimos dos Modelos de Estimacin que tienen diferente estructura.
Aunque el anlisis de estabilidad de los dos es casi idntico, solo el segundo modelo puede ser
fcilmente extendido a sistemas de alto orden. La entrada u y la salida x p de los dos modelos estn
relacionadas por ecuaciones diferenciales ( ver Graficos 5.1 y 5.2 ).

x p = a p ( t ) x p + kp ( t ) u ( t ) . Modelo 1 (5.0.a)
y

x p = am x p ( t ) + ( a p ( t ) am ) x p ( t ) + kp ( t ) u ( t )

am < 0 . Modelo 2 (5.0.b)

a p ( t ) y k p ( t ) en los dos modelos representan respectivamente los estimados de a p y k p en el


tiempo t . El objetivo es ajustar a p ( t ) y k p ( t ) de tal manera que

lim a p ( t ) = a p
t

lim kp ( t ) = k p
t

An cuando todas las seales en el sistema entero permanezcan acotadas. Adems, esto tiene que
ser realizado usando las derivadas de tiempo de las seales observadas ya que el ruido est presente
invariablemente.

51

kp

xp

s ap

k p

x p

a p

MODELO 1

Grafico 5.1

kp

xp

s ap

a p am

+
u

k p

1
s am

MODELO 2

x p
Grafico 5.2

Definiendo el error entre la salida correcta x p ( t ) de la planta y la salida estimada x p ( t ) como e ( t ) y


los parmetros del error entre a p ( t ) y a p y k p ( t ) y k p como

(t )

(t )

respectivamente, as

tenemos las ecuaciones diferenciales del error:

e ( t ) = a p e ( t ) + ( t ) x p ( t ) + ( t ) u ( t ) . Modelo 1 (5.1.a)
e ( t ) = am e ( t ) + ( t ) x p ( t ) + ( t ) u ( t ) .. Modelo 2 (5.1.b)
Con

e(t )

x p ( t ) x p ( t )

( t ) a p ( t ) a p

( t ) kp ( t ) k p
52

En trminos de las ecuaciones de error de los modelos el objetivo puede ser establecido como la
determinacin de una regla para el ajuste de a p ( t ) y

( t ) tiendan
(t )

(t )

k p ( t ) haciendo que los errores ( t ) y

acero cuando t . Es claro que si u ( t ) y x p ( t ) estn acotadas uniformemente y


tienden a cero, el error e ( t ) tambin tiende a cero asintticamente. De aqu que la

convergencia del error de salida a cero necesariamente se obtendr si el parmetro exacto es


alcanzado. Ya que el parmetro del error nunca es conocido explcitamente, el xito del
procedimiento de identificacin debe ser inferido en la prctica del desempeo del error de salida
medido.

5.b. Leyes adaptativas


La ley adaptativa para el Modelo 2. La ecuacin (5.1.b) representa el primer paso importante en la
descripcin matemtica del proceso de identificacin usando el Modelo 2. Indica como los errores
de parmetro afectan el error de salida en el sistema. Ya que el identificador es un diferenciador libre,
intentamos obtener leyes de identificacin adaptativas de la forma:

a p ( t ) = f1 x p ( t ) , u ( t ) , x p ( t ) , a p ( t )
k p ( t ) = f 2 x p ( t ) , u ( t ) , x p ( t ) , k p ( t )

(5.2)

As que el ajuste de los parmetros a p ( t ) y k p ( t ) estn basados en todas las seales que pueden ser
medidas directamente. Las funciones

f1 y f 2 han de ser escogidas de tal manera que las

ecuaciones 5.1.b y 5.2 constituyan un sistema de tercer orden cuyos puntos de equilibrio estn dados
por

a p = a p , kp = k p y e = 0 sea estable globalmente. Unas de esas reglas son:


a p ( t ) = e ( t ) x p ( t )
k p ( t ) = e ( t ) u ( t )

. (5.3)

Ya que a p y k p son constantes, las leyes adaptativas anteriores pueden ser expresadas en trminos
de los errores de parmetro

(t )

y ( t ) como:

( t ) = e ( t ) x p ( t )
( t ) = e ( t ) u ( t )
En este caso el estado de equilibrio

.. (5.4)

e = = = 0 puede mostrarse que es estable globalmente. La

justificacin para la eleccin de la leyes adaptativas (5.3) est basada en la candidata para funcin
de Lyapunov

V ( e, , ) =

1 2
e ( t ) + 2 ( t ) + 2 ( t ) (5.5)
2
53

V ( e, , ) es una forma cuadrtica de e ( t ) , ( t ) y ( t ) y es definida-positiva. Evaluando su


derivada a lo largo de cualquier trayectoria de las ecuaciones diferenciales (5.1.b) y (5.4) se produce

V ( e, , ) = am e 2 ( t ) + ( t ) e ( t ) x p ( t ) + ( t ) e ( t ) u ( t ) + ( t ) ( t ) + ( t ) ( t ) ..

(t )

(t )

(t )

as

(5.6)

en la ecuacin (5.6) deben ser tales que cancelen los trminos que contienen

(t ) y

V se vuelve semidefinida-negativa. Esto sugiere ley adaptativa en la ecuacin (5.4) de la

cual obtenemos

V ( e, , ) = am e 2 ( t ) 0 (5.7)
Por lo tanto, V ( e, , ) es una funcin de Lyapunov y el origen es estable uniformemente y
globalmente. Se desprende que e ( t ) ,

(t )

( t ) estn acotadas para todo t t0 .

Se debe notar que ya que los errores de parmetro

(t ) y (t )

en cualquier tiempo t no son

conocidos (ya que a p y k p son desconocidos) la ley adaptativa no puede ser implantada como esta
dada en la ecuacin (5.4). Por lo tanto, mientras el anlisis del sistema adaptativo puede ser llevado a
cabo convenientemente usando las ecuaciones de error (5.1.b) y (5.4), la implantacin prctica de la
ley adaptativa tiene que ser llevada a cabo en trminos de los parmetros a p ( t ) y k p ( t ) como est
dado en la ecuacin (5.3).
Ya que

V ( e ( ) , ( ) , ( t ) )d = V ( t0 ) V ( ) <

t0

tenemos que

0 e 2 ( )d <
t0

O que e 3 . Ya que e ( t ) como est dado por la ecuacin (5.1.b), est acotada, se desprende del
2

siguiente Lema
Si f :

es continua uniformemente para t 0 , y si el lmite de la integral

existe y es finito, entonces

lim f ( ) d
t

lim f ( t ) = 0 .
t

Por lo tanto, en este caso lim e ( t ) = 0 .


t

En tiempos iniciales del control adaptativo se poda concluir de las ecuaciones (5.5) y (5.7) que

lim e ( t ) = 0 . Sin embargo, como se ve en el anlisis anterior, que slo podemos concluir que e 3 2 .
t

54

Ya que una funcin puede ser una cuadrtica integrable sin tender a cero, es claro que condiciones
adicionales son necesarias para que e ( t ) tienda a cero asintticamente.

5.c. Ganancias adaptativas


En la discusin anterior, las leyes adaptativas en la ecuacin (5.4) aseguran la existencia de la funcin
de Lyapunov de la forma V =

1 2
e + 2 + 2 . Si, por otra parte V ( e, , ) es elegida para que
2

tenga la forma

V=
donde

1 2 1 2 1 2
e + +
1
2
2

son constantes positivas, las leyes adaptativas deben tener la forma:

= 1ex p

= 2eu
Para hacer V ( e, , ) una funcin de Lyapunov,

son referidas como ganancias adaptativas.

Ya que el sistema entero es estable globalmente para todos los valores positivos de

2,

las

ltimas pueden ser escogidas para optimizar el desempeo del sistema entero en algn sentido.

5.d. Simulacin de identificacin de una planta lineal


Ver programas de Matemtica Identificacin_1, Identificacin_2, Identificacin_3
La identificacin de la planta con a p = 1 y k p = 1 , usando el procedimiento discutido se muestra en
el programa Identificacin_1. El parmetro am en la ecuacin (5.0.b) es igual a -3 y la simulacin es
llevada a cabo cuando: (i) u ( t ) 0 , (ii) u ( t ) 2 y (iii) u ( t ) = 2 cos t + 3cos 2t . Las condiciones
iniciales se eligieron como se indica en la figura. En cada caso, el error de salida e ( t ) y la norma de
los errores de parmetro
(i)

( t ) = 2 ( t ) + 2 ( t )

son mostrados como funciones de tiempo.

Cuando u ( t ) 0 se ve que el error de salida converge a cero asintticamente mientras que los
errores de parmetro convergen a una constante con valor no-cero (programa Identificacin_1).

55

xe@tD Rojo ; xp@tD Verde


1
0.8
0.6
0.4
0.2

e@tD error
2

0.1
0.05

-0.05
-0.1
-0.15
@tD norma de par metros

1.52

1.48
1.46
1.44
1.42

(ii)

Cuando u ( t ) 2 se observa un desempeo similar de los errores. El valor asinttico de

(t )

es

ms pequeo en este caso ( programa Identificacin_2 ).

56

xe@tD Rojo ; xp @tD Verde


1

1.95
1.9
1.85
1.8
1.75

e@tD error
0.2
0.1

-0.1
-0.2
-0.3

@tD norma de par metros

1.4
1.38
1.36
1.34
1.32

(iii)

Cuando u ( t ) = 2 cos t + 3cos 2t , e ( t ) ,

(t ) y (t )

tienden a cero asintticamente

( programa Identificacin_3 ).

57

xe@tD Rojo ; xp @tD Verde


3
2
1

10

12

14

-1

e@tD error
0.1
0.05

10

12

14

-0.05
-0.1
@tD norma de par metros

0.4
0.3
0.2
0.1

10

12

14

58

5.e. Identificacin de plantas no-lineales


En la ecuacin diferencial del error (5.1.b), el lado derecho es una funcin lineal de los errores de
parmetro

Adems, estos errores estn asociados con las seales x y u que pueden ser

medidas. Este hecho nos permite construir leyes de identificacin estables de la forma de las
ecuaciones (5.4). De aqu que el mismo procedimiento puede ser extendido a la identificacin de
casos especiales de plantas no-lineales como se muestra ms abajo.
Sea la planta que va a ser identificada de la forma

x p = a p x p + f ( x p ) + k p g ( u ) .. (5.8)
donde a p , y k p son parmetros escalares constantes que son desconocidos, f ( ) y

g ( ) son

funciones no-lineales suaves conocidas tales que x p = 0 es el nico estado de equilibrio de la


ecuacin (5.8) cuando g ( u ) 0 , y la ecuacin (5.8) tiene soluciones acotadas para una entrada
acotada u . Para estimar los parmetros desconocidos, construimos un estimador de la forma:

x p = am x p + ( a p ( t ) am ) x p + ( t ) f ( x p ) + k p ( t ) g ( u )
As que el error e satisface la ecuacin diferencial

e = am e + ( a p ( t ) a p ( t ) ) x p + ( ( t ) ) f ( x p ) + kp ( t ) k p g ( u )
y tiene la misma forma como la ecuacin (5.1.b). Asimismo se desprenden las leyes adaptativas de
identificacin de la forma:

a p = ex p

= ef ( x p )
k p = eg ( u )
pueden ser usadas para asegurar la estabilidad global de todo el sistema con el error de salida
tendiendo a cero asintticamente.
Simulacin de Identificacin de una Planta No-lineal
Ver programas de Matemtica: Identificacin_N1, Identificacin_N2 e Identificacin_N3
Los resultados obtenidos de la identificacin de una planta no-lineal descrita por la ecuacin
diferencial

x p = x p 2 x 3p + u
Ahora se muestra en el programa Identificacin_N1 con am = 3 , con condiciones iniciales como se
muestra en el programa y las mismas entradas como en el programa Identificacin_1. El error de
salida se ve que tiende a cero para u ( t ) 0 y u ( t ) 3 como se observa en los programas
59

Identificacin_N1 e Identificacin_N2 pero los errores de parmetro no. Para u ( t ) = 2 cos t + 3cos 2t ,
la salida as como los errores de parmetro tienden a cero. La velocidad de convergencia del error
de parmetro en el programa Identificacin_N3
Identificacin_3.

es mucho mas lenta que en el programa

y@tD Rojo ; x@tD Verde

1
0.8
0.6
0.4
0.2

e@tD error

0.1
0.08
0.06
0.04
0.02
@tD norma de par metros

4
3
2
1

Identificacin No-lineal programa Identificacin_N1


60

y@tD Rojo ; x@tD Verde


1.03
1.02
1.01

10

12

14

0.99

e@tD error

0.98

1
0.8
0.6
0.4
0.2

@tD norma de par metros

10

12

14

1.2

1.1

10

12

14

0.9

0.8

Identificacin No-lineal programa Identificacin_N2


61

y@tD Rojo ; x@tD Verde


2
1.5
1
0.5

20

40

60

80

60

80

-0.5
-1

e@tD error
0.1

0.05

20

40

-0.05
@tD norma de par metros

2.25
2
1.75
1.5
1.25
20

40

60

80

0.75
0.5

Identificacin No-lineal programa Identificacin_N3


62

5.f. Control directo; el caso escalar


El problema ms simple de control adaptativo de un sistema dinmico puede ser establecido en
trminos de una planta de la forma descrita para el caso escalar anteriormente expuesto.
Una planta con un par entrada-salida

{u () , x ()} est descrito por la ecuacin diferencial


p

escalar

xp (t ) = ap (t ) xp (t ) + k p (t ) u (t )
donde a p ( t ) y k p ( t ) son parmetros de la planta. Un modelo de referencia es descrito por la
ecuacin diferencial de primer orden

xm ( t ) = am xm ( t ) + km r ( t ) . (5.9)
donde am < 0 , am , km son constantes conocidas y r es un tramo-continuo de una funcin de tiempo
acotada. Se asume que am , km y r han sido escogidas para que xm ( t ) represente la salida deseada
de la planta en el tiempo t . El objetivo es determinar una entrada de control u acotada,
permaneciendo todas las seales del sistema acotadas y

lim x p ( t ) xm ( t ) = 0 (5.10)
t

Si a p ( t ) y k p ( t ) pueden ser directamente ajustados y sus valores son conocidos esto puede ser
alcanzado trivialmente por la eleccin

a p ( t ) am

k p ( t ) km

u ( t ) = r ( t ) , t t0

Para hacer el problema ms realista, se asume que los valores iniciales de a p ( t ) y k p ( t ) son
desconocidos pero sus derivadas de tiempo pueden ser ajustadas usando la medicin de seales en
el sistema. Cuando se estableci de esta manera, el problema de control se ve idntico a un
problema de identificacin usando el Modelo 1. En este caso el error entre las salidas de la planta y el
modelo de referencia satisfacen la ecuacin diferencial

e ( t ) = am e ( t ) + ( a p ( t ) am ) x p ( t ) + ( k p ( t ) km ) r ( t ) ..(5.11)
Si las leyes adaptativas

a p ( t ) = e ( t ) x p ( t )
k p ( t ) = e ( t ) r ( t )

(5.12)

son usadas. Las ecuaciones (5.11) y (5.12) son similares a las ecuaciones (5.1.b) y (5.3). Su estabilidad
global puede ser mostrada de la misma manera que fue descrita anteriormente.

63

5.g. Control por retroalimentacin


En la prctica, el ajuste directo de los parmetros de la planta como esta descrito anteriormente no
puede ser posible y el desempeo de la planta puede estar alterado slo por el uso de ganancias de
alimentacin al frente y retroalimentacin. Si a p y k p son constantes conocidas, la planta esta dada
por:

x p ( t ) = a p x p ( t ) + k p u ( t ) (5.13)
entonces una entrada de control de la forma

u ( t ) = x p ( t ) + k r ( t ) .(5.14)
puede ser elegida cuando

am a p
kp

km
kp

Usando la expresin de la ecuacin (5.14) en la ecuacin (5.13) se puede ver que la funcin de
transferencia de la planta junto con el controlador ser lo mismo que lo que el modelo de referencia
a fin de que se el objetivo en la ecuacin (5.10) se cumpla. Se est seguro de la existencia de tales

k proporcionando un k p 0 , esto es, cuando la planta es controlable. Cuando a p y k p son

desconocidas, la entrada de control se elige para tener la forma siguiente

u ( t ) = ( t ) x p ( t ) + k ( t ) r ( t ) . (5.15)
Donde

(t )

(t )

y k ( t ) son los parmetros ajustables del controlador. La adaptacin debe ser tal que

y k ( t ) evolucionen a valores constantes

y k

respectivamente. La planta dada por la

ecuacin (5.13) junto con el controlador adaptativo en la ecuacin (5.15) la cual referiremos en
adelante como el sistema puede ser descrito por:

x p ( t ) = ( a p + k p ( t ) ) x p ( t ) + k p k ( t ) r ( t ) . (5.16)
Definiendo el error de salida e y los errores de parmetro

e (t )

x p ( t ) xm ( t ) , ( t ) ( t ) y ( t )

como:

k (t ) k

Obtenemos la ecuacin del error de las ecuaciones (3.17) y (3.24) como

e ( t ) = am e ( t ) + k p ( t ) x p ( t ) + k p ( t ) r ( t ) . (5.17)
El problema entonces es determinar como

(t )

y k ( t ) o alternativamente

(t )

(t )

son

ajustados usando toda la informacin disponible.

64

Caso cuando k p es desconocido (el signo de k p es conocido)


En este caso, la entrada tiene la forma de la ecuacin (5.15). Como se muestra adelante, la
presencia del trmino k p en la ecuacin del error (5.17) requiere una modificacin de las leyes
adaptativas para mantener estabilidad. En particular las leyes adaptativas son escogidas como:

( t ) = ( t ) = sgn ( k p ) e ( t ) x p ( t )
k ( t ) = ( t ) = sgn ( k p ) e ( t ) r ( t )

(5.18)

donde sgn ( x ) est definida como

+1, si,..x 0
sgn ( x ) =
1, si,..x < 0
La candidata a funcin de Lyapunov

V ( e, , )

1 2
e + k p ( 2 + 2 ) . (5.19)

tiene una derivada de tiempo V ( e, , ) , la cual cuando es avaluada a lo largo de las soluciones de
las ecuaciones (5.17) y (5.18) que conduce a

V ( e, , ) = ee + k p +
= am e 2 + k p ex p + k p er k p sgn ( k p ) ex p + sgn ( k p ) er
= am e 2 0 . (5.20)
Se concluye de las ecuaciones (5.19) y (5.20) que el estado de equilibrio del sistema descrito por las
ecuaciones (5.17) y (5.18) es estable uniformemente y globalmente. Ya que e es acotado y e 3 , se
2

puede mostrar que

lim e ( t ) = 0 .
t

Como en el problema de identificacin, los resultados no estn afectados por la introduccin de


ganancias adaptativas positivas

en las leyes adaptativas.

5.h. Control de plantas no-lineales


Se mostrar que el procedimiento adoptado anteriormente para obtener el control adaptativo
estable de una planta lineal de la ecuacin (5.13) puede tambin ser extendido a una clase de
plantas no-lineales. Esto se indica brevemente a continuacin
Sea la planta no-lineal que ser controlada adaptativamente dada por:

x p = a p x p + f ( x p ) + k p u (5.21)
65

( ) pueden ser medidas, y f () es una funcin

donde a p , k p , son desconocidas, x p as como f x p

suave de ese argumento con f ( 0 ) = 0 . Es deseado que x p siga la salida xm del lineal modelo de
referencia dado en la ecuacin (5.9). Escogemos una entrada de control de la forma

u = ( t ) x p + ( t ) f ( x p ) + k ( t ) r . (5.22)
y las leyes adaptativas para ajuste

( t ) , ( t )

y k ( t ) dadas por:

= sgn(k p )ex p
= sgn(k p )ef ( x p )

. (5.23)

k = sgn(k p )er
Usando los mismos argumentos de antes, se puede mostrar que el sistema entero dado por las
ecuaciones (5.21)-(5.23) tiene soluciones acotadas y que lim e ( t ) = 0 .
t

Simulacin 3.4
Los resultados son del control de un sistema no-lineal x p = x p + 3 x p + u con un modelo de referencia
3

descrito por xm = xm + r . La convergencia del error de salida y los errores de parmetro se muestran
en los programas de Matemtica Control_1, Control_2 y Control_3 para

a) r ( t ) 0 , b) r ( t ) 5 y c)

r ( t ) = 2 cos t + 3cos 2t .

xp @tD Rojo ; xm@tD Verde

3
2.5
2
1.5
1
0.5
2

66

e@tD error
3
2.5
2
1.5
1
0.5
@tD norma de par metros

9.35
9.3
9.25
9.2
9.15
2

9.05

Problema de Control

programa Control_1

xp @tD Rojo ; xm@tD Verde


5
4
3
2
1

7
67

e@tD error
0.02
0.01

10

-0.01
-0.02
-0.03

@tD norma de par metros

7.1

6.9

6.8

6.7

Problema de Control

programa Control_2

xp@tD Rojo ; xm @tD Verde


3
2
1

20

40

60

80

100

120

140

-1

68

e@tD error
0.3
0.2
0.1
20

40

60

80

100

120

140

-0.1
-0.2
-0.3
@tD norma de par metros

9
8
7
6
5

20

40

60

80

100

Problema de Control

120

140

programa Control_3

Comentarios 3.1
i) En el problema de control, la planta, como est descrita en la ecuacin (5.13) puede ser inestable.
ii) En el problema de identificacin, el objetivo principal es estimar los parmetros a p y k p de la
planta. En contraste con esto, el objetivo en el problema de control es slo que la salida de la
planta siga la salida del modelo asintticamente. Por lo tanto, la convergencia de los parmetros
a los valores deseados, lo cual es central para el problema de identificacin, no es crtico en el
problema de control. En ambos casos, sin embargo, la excitacin persistente de la entrada
pertinente es necesaria para asegurar la convergencia de parmetros.
iii) En el problema de identificacin, los parmetros del modelo de identificacin son ajustados.
Cualquier inestabilidad que pueda resultar, puede manifestarse en s misma slo en este modelo.
En contraste con esto, en el problema de control, los parmetros del controlador son ajustados en
el lazo de retroalimentacin de la planta. Por lo tanto, el proceso controlado puede llegar a ser
inestable, lo cual para un punto de vista prctico, puede llegar a ser desastroso.
69

iv) La estructura del modelo de identificacin esta a la discrecin del diseador y es determinado
por la parametrizacin especfica de la planta que es usada. La identificacin de parmetros es
llevada a cabo en el contexto de esta estructura predeterminada. Ya que la planta se asume
que es estable y las entradas acotadas, la parametrizacin puede ser escogida de tal manera
que la identificacin es llevada a cabo usando seales acotadas conocidas. En contraste a esto
slo la entrada de referencia

r puede ser asumida que ser acotada en el problema de control

y la limitacin de todas las seales en el lazo adaptativo tiene que ser demostrada usando la
eleccin de leyes adaptativas especficas.

6. REDES NEURONALES PARA CONTROL


6.a. Introduccin
Las Redes Neuronales artificiales estn modeladas de manera parecida a aquellas que intervienen en
los

procesos biolgicos, a su procesamiento de la informacin y de manera especial al

funcionamiento de la unidad bsica del sistema nervioso, la neurona.


La neurona recibe mltiples seales de otras neuronas a travs de las dendritas, cada seal es
multiplicada por un coeficiente de peso. Estas seales son sumadas en el cuerpo de la clula o soma
y cuando la seal compuesta alcanza un umbral de valor, una seal conocida como la accin
potencial es enviada a travs del axn, el cual es el canal de salida de la neurona. Este es el principio
base de una red neuronal artificial. Los atributos bsicos de las Redes Neuronales se dividen en dos: su
arquitectura y sus propiedades funcionales neurodinmicas.
Arquitectura: nmero de neuronas artificiales y su interconectividad.
Neorodinmicas: Define las propiedades de las redes neuronales como aprender, recordar,
asociar y comparar constantemente nueva informacin con el conocimiento existente.
Una red neuronal descompone informacin compleja en elementos caractersticas
fundamentales y esos elementos y sus relaciones entre cada uno son almacenados en los banco de
memoria del cerebro.
Sabemos que entre las muchas utilidades las redes neuronales tienen la habilidad de
aprender, clasificar, almacenar, recordar, cruzar referencias, interpolar, extrapolar, adaptar
parmetros y realizar mantenimiento de la red. Durante el proceso de aprendizaje la red ajusta sus
pesos, La sinapsis de pesos , en respuesta a un estmulo de entrada, as que la actual respuesta de
salida converge a la respuesta de salida deseada. Cuando la salida actual responde de la misma
manera que la deseada, la ha acompletado la fase de aprendizaje, es decir adquiri el
conocimiento. Si la actual respuesta difiere de la respuesta objetivo se genera un error de seal. El
proceso de minimizacin del error requiere de un circuito especial y de un maestro o supervisor, de
aqu el nombre de Aprendizaje Supervisado.
70

Con redes neuronales artificiales la cantidad de clculos requeridos para minimizar el error
depende del algoritmo usado. Las tcnicas de optimizacin matemtica son de uso extensivo en los
modelos de redes neuronales. Algunos parmetros a observar son: el tiempo requerido por iteracin,
el nmero de iteraciones por entrada, patrn cuando el error alcanza un mnimo durante una sesin
de entrenamiento. La red neuronal alcanza ya sea un mnimo local o uno global y si es local saber
como se puede salir de el.
Matemticamente hablando, una red neuronal representa un sistema dinmico que puede
ser modelado como un conjunto de ecuaciones diferenciales acopladas. Para la teora de
retroalimentacin, un sistema como este depende de los valores de los parmetros de la ecuacin,
pequeos cambios en los parmetros pueden dar por resultado: estabilidad, inestabilidad
(oscilaciones) o an inestabilidad catastrfica (caos).
Las redes neuronales estn caracterizadas por:
1.- La computacin de los programas en forma colectiva y cinergtica. Las operaciones estn
descentralizadas.
2.- Robustez. La operacin es insensible a fallas diseminadas. La operacin es insensible a
entradas parciales o a entradas con imprecisiones.
3.- Aprendizaje. La red hace asociaciones automticamente. El programa es creado por la
red durante el aprendizaje.
4.- La red se adapta con o sin maestro. No interviene el programador.
5.- Un nmero grande de redes neuronales requiere sincronizacin
Las poderosas tcnicas desarrolladas en el rea de control adaptativo complementan la actual
tecnologa computacional y tienen un enorme potencial en el mundo de las aplicaciones, donde los
sistemas han estado controlados en la presencia de incertidumbre. Aunque los sistemas adaptativos
son muy no-lineales por su naturaleza, la mayora de las teoras de tales sistemas estn originadas en
sistemas lineales.
En los aos recientes, las redes neuronales multicapa y las recientes redes han emergido como
componentes importantes, las cuales han probado ser muy exitosas en el reconocimiento de
patrones y problemas de optimizacin. Para un punto de vista terico, ests redes pueden ser
consideradas como componentes que pueden ser usados de manera efectiva en sistemas no-lineales
complejos. Tpicamente, las entradas son donde los patrones de entrada son aplicados, la capa
donde la salida es obtenida es la capa de salida y las capas entre las entradas y la capa de salida
son las capas ocultas, estas se llaman as porque sus salidas no son directamente observables.
El control neuronal ha encontrado muchas aplicaciones en control. En general, una red
neuronal puede ser entrenada para responder a variaciones en las entradas de tal manera que la
salida se mantiene tan cercana como es posible a la salida deseada. Como en control tradicional se
puede tener un sistema de control de lazo abierto de lazo cerrado.

71

La red de retroalimentacin continuamente aprende, clasifica, genera nuevas asociaciones


de entradas-salidas y actualiza la red hacia delante. As esta red de retroalimentacin dentro de
ciertas fronteras de conocimiento, tiene la inteligencia para aprender y adaptarse continuamente.
Aplicaciones
Las redes neuronales artificiales y la lgica difusa no son slo curiosidades cientficas. ellas han sido
aplicadas en varios productos; ejemplos hay muchos. En los trenes del metro se usan para determinar
los inicios y paros adecuados y la velocidad de crucero de los trenes; en mquinas de lavado,
determina la cantidad de agua y el nmero de enjuagues; en cmaras y videograbadoras ajusta el
color, contraste, brillo, foco, etc. En automviles con transmisin automtica, determina el engranaje
adecuado; en sistemas vehiculares inteligentes encuentra la mejor ruta automticamente gua al
automvil; y en sistemas de comunicacin, seales de proceso, rutas de canales y el sistema de
controles. Otros ejemplos incluyen una variedad de sistemas. En Ingeniera financiera; en patrones de
reconocimiento de voz y pticos; en sistemas de seguridad; en robtica para gua y control de
movimiento, reconocimiento de patrones pticos y manipulacin de objetos. Se da una particular
atencin en seales de proceso (ecualizacin, supresin de ondas reflejo); en proceso de datos
(imagen y voz); en sistemas de comunicacin ( control del trfico de flujo, desviaciones ) y en control
( controladores y robtica ).
Las redes neuronales pueden ser diseadas con circuito digital, con circuito anlogo o con la
combinacin de ambos. El diseo con circuito digital es lo ms reciente. Los circuitos digitales son ms
conocidos y ms usados que los otros mtodos, las entradas y salidas son binaria y eso hace que los
clculos ms fciles. Sin embargo las redes neuronales digitales tienen aplicaciones limitadas.
El control adaptable usando computadoras ha progresado mucho desde 1970. Importantes
investigaciones en control inteligente continan y muchas aplicaciones han encontrado su camino
en el mercado usando lgica difusa y redes neuronales.
Un uso concerniente al control de motores industriales es la habilidad para predecir fallas del
sistema. Las fallas del motor dependen de parmetros especficos del motor tales como corriente
pasajera, caractersticas de envejecimiento, posicin del motor, y otras que hacen que la prediccin
de fallas sea una tarea difcil. Redes neuronales son usadas para aprender las invariantes de la
corriente del motor y de las caractersticas de instalacin. De un 80% a 90% de precisin de la
prediccin se alcanza, comparada con el 30% con otras tcnicas del estado del arte.
Muchas diferentes aplicaciones de redes neuronales se unen en robtica. Es tpico, el ms
simple robot estacionario con el movimiento de un brazo y un juego de sensores (es decir, una videocmara ) para objetos sensibles. Son enseadas a ejecutar varias tareas a los robots. Las ms simples
tareas de movimiento, reconocimiento de objetos y manipulacin de objetos. Ms robots inteligentes
son no-estacionarios, reconocen objetos, y ejecutan mltiples tareas como control de movimiento y
balance, control de gua, evitar colisiones, control de brazos mltiples, identificacin de objetos,
72

soporte y manipulacin, reconocimiento de voz, generacin de voz, racionamiento elemental y


comunicacin de datos.
Redes neuronales y lgica difusa han sido usadas en muchas aplicaciones vehiculares,
incluyendo trenes, cambios en transmisiones automticas y vehculos inteligentes. El ALVINN
(Autonomous Land Vehicle in a Neural Network ) es un proyecto para un vehculo de navegacin
autnoma. Mas trabajo en esta rea de sistemas de control con lgica difusa es la propuesta para
controlar la velocidad en vaco de un motor automotriz.
En mquinas de rolado de acero el espesor devastado es controlado con tolerancias muy
pequeas. El controlador tiene en cuenta algunas variables, muchas de ellas no-lineales. Algunas de
ellas son el espesor a la entrada y a la salida, la fuerza de rolado, ubicacin de los sensores de espesor
y velocidad del devanado como movimiento entre rollos. Una aplicacin propuesta usa una red
neuronal con funcin bsica radial (RBF).

6.b. Estructura de la Red Neuronal


Un modelo matemtico de una Red Neuronal se muestra en la figura 6.a. La Red Neuronal tiene dos
capas de pesos ajustables lo que la identifica como una Red Neuronal Estandar de dos capas para
control de manipuladores
Los valores xk son las entradas y yi son las salidas de la Red Neuronal. La funcin

( )

es una

funcin de activacin contenida en el la capa oculta de la red. Los pesos de la capa oculta de la
red son v jk y los de la capa de salida son wij . Los sesgos de la capa oculta son
capa de salida son

vj y los sesgos de la

wi . El nmero de neuronas de la capa oculta esta dado por L .

La frmula matemtica que describe la Red Neuronal indicada en la figura 6.a esta dada
como:
L

yi = wij v jk xk + vj + wi
j =1
k =i

i = 1, 2,..., m ... (6.b.1)

Se puede aclarar esto por la definicin de las matrices de pesos:

v1

T
V = v2

vL

v11
v21
vL1

v1n
v2 n
,

vLn

w1

T
W = w2

wm

w11
w21
wm1

w1L
w2 L
. (6.b.2)

wmL

Las cuales contienen los sesgos en las primeras columnas. Entonces la Red Neuronal puede ser escrita
como:

y = W T (V T x ) . (6.b.3)
Donde el vector de salidas es

y = [ y1

y2

ym ] y el vector de entradas considerando el sesgo


T

en la primer columna es:


73

x = [1 x1
El

x2

xn ]

j simo rengln de V T x est dado por:

vj

v j1 v j 2

Adems la funcin de activacin

1
x
n
1
v jn x2 = vj + v jk xk = z j

k =1

xn

(zj )

como se presenta en la ecuacin (6.b.3) esta definida como

un vector funcin de la capa oculta. La cual esta representada en este caso por la funcin sigmoidal

( z) =
donde si

1
1 + e z

z = [ z1 , z2 ,...]

es un vector, se puede definir el vector

incluyendo el uno como el primer trmino en el vector

wi

como la primer columna de

(V T x )

( z ) = ( z1 ) , ( z2 ) ,...

permitiendo incorporar los sesgos

W T . Cualquier ajuste de W y de V incluir tambin un ajuste de

sesgos. Aunque para tener en cuenta sesgos distintos de cero, se considera

x0 = 1 y por la primer

entrada que es uno.

6.c. El algoritmo de Retropropagacin


El perceptrn multicapa MLP es utilizado en las Redes Neuronales para seguimiento y control. Para la
actualizacin de pesos han sido usados diferentes algoritmos, los mas comunes son el Delta y el de
Retropropagacin.
El algoritmo de retropropagacin ha sido ampliamente utilizado como un algoritmo de
aprendizaje en redes neuronales multicapas con alimentacin hacia delante, con una o ms capas
ocultas.

74

1
vj
V
x1

Sesgo

1 Sesgo
wi
s(.)

WT
wij

vjk

y1

2
Entradas

s(.)

Salidas

x2

y2

ym

3
s(.)

xk

s(.)

Capa de Salida

Capa Oculta

Modelo de Estructura de Red Neuronal de Dos Capas


para control de manipuladores

Figura 6.a

Basados en este algoritmo, la red aprende un mapeo de distribucin asociativa entre las capas de
entradas y salidas. Lo que hace que este algoritmo sea diferente de los otros es el proceso por el cual
los pesos son calculados durante la fase de aprendizaje de la red.
Para actualizar los pesos se debe calcular el error. En la capa de salida el error es fcilmente
medible que es la diferencia entre el valor actual de salida y el valor objetivo, sin embargo en las
capas ocultas no hay una observacin directa del error de aqu que otras tcnicas deben utilizarse
para calcular el error en las capas ocultas que logren minimizar el error de salida.
Durante una sesin de entrenamiento de la red, se presentan un par de patrones (Xk, Tk ) donde
Xk es el patrn de entradas y Tk es el patrn de objetivos deseado. El patrn Xk causa respuestas en las
salidas de cada neurona en cada capa y as hasta la capa de salidas con las salidas actuales Ok. En
la capa de salida la diferencia entre la salida actual y la salida objetivo producen los errores de seal.
El error de seal depende de los valores de los pesos de las neuronas en cada capa. La velocidad y
precisin del proceso de aprendizaje, esto es, el proceso de actualizacin de pesos, tambin
depende de un valor conocido como tasa de aprendizaje.
La actualizacin de los pesos para la Capa de Salida W est dada por:

Wt +1 = Wt + F (Vt T xd ) EtT . (6.c.1(a))


75

Y la actualizacin de pesos para la Capa Oculta V est dada por:

Vt +1 = Vt + Gxd ( tT Wt Et ) (6.c.1(b))
T

Este es un algoritmo de ajuste de tiempo discreto donde el tiempo indexado es

xd R n est denotado como yd R m . El

de la Red Neuronal en respuesta a la entrada de referencia


error de salida de la Red Neuronal al tiempo
Red al tiempo t .

t . La salida deseada

t es Et = yd yt , donde yt R m es la salida actual de la

F , G son matrices de ponderacin seleccionadas por el diseador que determinan

la velocidad de convergencia del algoritmo.


El trmino
fcilmente.

( ) es

la derivada de la funcin de activacin la cual puede ser computada

= diag (V T xd ) I diag (V T xd )

La versin del ajuste por retropropagacin en tiempo continuo est dada como:

W = F (V T xd ) E T
V = Gxd ( TWE )

. (6.c.2)

Actualizacin de pesos para ejecucin de seguimiento garantizada


Para que un algoritmo de ajuste de pesos garantice el seguimiento estable del sistema en lazo
cerrado es requerido demostrar que el error de seguimiento r ( t ) esta adecuadamente pequeo y
que los pesos de las capas de las Redes Neuronales

V ,W

permanecen acotados y as entonces el

control r ( t ) tambin esta acotado.


En este caso no hay la fase de aprendizaje de las redes fuera de lnea, y los pesos de las redes
son fcilmente inicializados sin los requerimientos de pesos de estabilizacin inicial.
Retropropagacin para el caso ideal
El siguiente resultado detalla el desempeo del lazo cerrado en ciertas condiciones ideales que
demandan lo siguiente:
1) No hay error de reconstruccin funcional de la red
2) No hay perturbaciones no modeladas en las dinmicas del brazo robtico y
3) No hay trminos de alto orden de la serie de Taylor.
Se puede demostrar que bajo estas condiciones el algoritmo trabaja.
Teorema 6.c.1
Sea la trayectoria deseada acotada y suponer que el trmino de perturbacin w1 ( t ) es igual a cero
entonces el ajuste de pesos esta proporcionado por:
76

W = F r T . (6.c.3)

V = Gx T Wr

.. (6.c.4)

Y cualesquiera matrices constantes positivas


con el tiempo

F , G . Entonces el error de seguimiento r ( t ) va a cero

t y los pesos estimados de V y W estn acotados.

6.d. Aproximacin a funciones continuas con la Red Neuronal


Redes Neuronales para la Aproximacin de Funciones Continuas
Muchos resultados bien conocidos dicen que cualquier funcin suficientemente suave puede ser
aproximada arbitrariamente cercana sobre un conjunto compacto usando una Red Neuronal de dos
capas con pesos apropiados.
Los resultados para la aproximacin de funciones continuas dice que:
Teorema 6.d.A
Dada cualquier funcin f C ( S ) ( el espacio de funciones continuas ) con S un subconjunto
compacto de

R n y cualquier > 0 , existe una suma G ( x ) de la forma


G ( x ) = k ( mkT x + nk ) (6.d.1)
L

k =0

Para algn

L, mk R n , nk R tal que
G ( x ) f ( x ) < (6.d.2)

para toda x S .

Generalmente, si

mas pequeo, entonces el nmero

L de neuronas de la capa oculta es mas

grande. Esto es, es requerida una Red Neuronal mas grande para mayor precisin.
La funcin

(i)

puede ser cualquier funcin sigmoidal continua, donde una funcin sigmoidal

est definida como:

1...... para..x +
..(6.d.3)
0...... para..x

( x)

Este resultado muestra que cualquier funcin continua puede ser aproximada arbitrariamente bien
usando una combinacin lineal de funciones sigmoidales. Esta es conocida como La Propiedad de
Aproximacin Universal de las Redes Neuronales.
Una funcin general f ( x ) C

(S )

puede ser escrita como:


77

f ( x ) = W T (V T x ) + ( x ) ................... (6.d.4)
N1 = n, N 3 = m, y ( x ) un vector error de la reconstruccin funcional con Red Neuronal.

con
Si en

N 2 existen pesos ideales W y V y son constantes, entonces = 0 para toda x S . se dice

que f ( x ) est en el rango funcional de la Red Neuronal. En general, dada una constante real

N > 0,

decimos que f ( x ) esta dentro del rango de la Red Neuronal

constantes tales que para toda


cumple que

si existe

N 2 y pesos

x R n existe una f ( x) como se expresa en la ecuacin (6.d.4) que

< N .

Varios resultados conocidos para varias funciones de activacin

(i)

basados en el teorema de

Stone-Weierstrass dice que cualquier funcin suficientemente suave puede ser aproximada por una
red adecuadamente grande.
El rango funcional de la Red Neuronal se dice que es denso en C

N >0, existe un N 2
que

(S )

si para cualquier f C

(S )

finito, y una W y V tales que, de acuerdo con la ecuacin (6.d.4) se mantiene

< N , N1 = n , N3 = m .

Los resultados comunes son los siguientes para el caso de

las

funciones de aplastamiento (un lmite, medible, una funcin no decreciente para nmeros reales en

[0,1] ), las cuales incluyen por ejemplo el escaln, la rampa y la sigmoidal.


Teorema 6.d.A
Sea

N1 = n , N3 = m y sea cualquier funcin de aplastamiento. Entonces el rango funcional de la

Red Neuronal , ecuacin (6.b.3), es denso en C

(S ) .

En este resultado la mtrica que define la densidad es la norma del supremo. Ms an los sesgos de la
ltima capa
escoger

w w

no son necesarios en este resultado. Los cuestionamientos de seleccin de

, de

N 2 para un especial S R n y un N son los tpicos actuales de investigacin.

7. PERTURBACIONES
7.a. Tipos de perturbaciones
La mayora de los actuadores usados en aplicaciones de control son dispositivos de control continuo.
Si las relaciones de entrada-salida del mecanismo son ecuaciones algebraicas no-lineales, esto
representa una no-linealidad esttica. Por otro lado, si las relaciones entrada-salida son ecuaciones
diferenciales no-lineales, esto representa una no-linealidad dinmica. Como ejemplos de no78

linealidades estticas se encuentran: friccin, zonas muertas y saturacin; como no-linealidades


dinmicas se encuentran backlash e hysteresis.
Una clase general de procesos industriales tiene la estructura de un sistema dinmico precedido
por las no-linealidades del actuador. Problemas en el control de estos procesos son exacerbados
cuando la precisin requerida es alta, como en mecanismos de microposicionamiento Debido a la
naturaleza no-analtica de las no-linealidades del actuador y el hecho que sus funciones no-lineales
exactas son desconocidas, tales procesos representan un reto para el diseador de control.
Modelado de las perturbaciones en el espacio de estados
Si se quiere conseguir que la respuesta del sistema sea la que deseamos a pesar de las influencias que
las diferentes perturbaciones tienen sobre el sistema, resulta necesario comprender lo que son, as
como describirlas y modelarlas adecuadamente.
Las perturbaciones pueden tener diversos orgenes:
Variaciones en la carga a la que est sometido el sistema
Errores producidos en las medidas de la salida del sistema debidos al ruido, derivadas de los
sensores, errores en la transmisin de la seal, etc.
Variaciones en la planta y en los actuadores.
Simplificaciones y errores en el modelo matemtico del sistema que hacen que la salida real
no coincida con la modelada.
Las diferentes perturbaciones sobre el sistema w pueden conocerse en muchas ocasiones, por medio
de una serie de experimentos y pruebas sobre el sistema, y en este caso dicha informacin puede
utilizarse para construir un modelo matemtico mejorado del sistema.
Se pueden diferenciar dos situaciones, si las perturbaciones se pueden predecir o si no se
pueden predecir (ruido blanco). En el caso del modelado de sistemas no-lineales, las no-linealidades
pueden ser suaves o pronunciadas y se pueden dividir en dos grandes tipos, en funcin de su
naturaleza.
Funciones Analticas Simples. Estas son desarrolladas en serie de Taylor y que, por lo tanto
tienen todas sus derivadas. Entre estas funciones se encuentran las funciones potenciales, sinusoidales
o productos de estas, las cuales presentan una variacin suave.
Funciones lineales por partes o nolinealidades pronunciadas. No son funciones analticas
pero, sin embargo, dentro de cada zona el tratamiento es prcticamente lineal. Ejemplos de ellos son:
friccin, rel, saturacin, zona muerta, precarga y rectificacin.
Funciones multivariables. Representan los efectos de la evolucin temporal de las entradas
como son: rel con histrisis, la histresis magntica y el backlash.

79

rele

saturacin

zona muerta

Graficas correspondientes a no-linealidades pronunciadas

precarga
Grafico 7.1

Efectos de las No-linealidades


Entre los efectos debidos a la presencia de no-linealidades en el sistema se encuentran:

Aparicin de nuevas frecuencias sobre el sistema.


Al trabajar con sistemas no-lineales se puede ver que se modifica la frecuencia, es decir
aparecen nuevos armnicos y desarrollando la salida en serie de Fourier se tendrn nuevos
coeficientes no nulos:

y (t ) =

A0

+ n =1 An cos ( nt ) + Bn sin ( nt ) .
2

Prdida de la precisin esttica.


Se pierde la precisin esttica y puede haber ms de un punto de equilibrio. El punto puede
depender de las condiciones iniciales. Por ejemplo la friccin puede producir una banda de
friccin.

Tiempos de respuesta de tipo distinto a exponenciales reales o complejas.


Pueden aparecer respuestas de tipo distinto a exponenciales reales o complejas como son las
oscilaciones exponencial decreciente y las oscilaciones lineal decreciente.

Aparicin de Ciclos Lmite.


Los ciclos lmite son oscilaciones no-lineales con frecuencia fija y cuya amplitud no depende de
las condiciones iniciales.

7.b. Friccin en servomecanismos


La friccin es la resistencia natural relativa al movimiento entre dos cuerpos en contacto y es esencial
para la operacin comn de sistemas mecnicos (ruedas, embragues, etc.) Pero en la mayora de los
procesos industriales esto tambin representa un problema ya que es difcil modelar y problemtico
tratarla en el diseo de sistemas de control. Fabricantes de componentes de sistemas de control de
precisin se esfuerzan en minimizar la friccin y esto representa un incremento importante en los
costos. Sin embargo, no obstante los esfuerzos en reducir la friccin el problema permanece.
En los posibles efectos de friccin no deseables se incluye hangoff y los ciclos lmite. El hangoff
evita el error en estado estable para el conveniente cero con un paso mandado en la entrada (esto
80

puede interpretarse como un ciclo lmite de corriente directa). El ciclo lmite es el comportamiento en
el cual el error en estado estable oscila alrededor de cero.
La friccin es un fenmeno no-lineal complicado en el cual se produce una fuerza que tiende a
oponerse al movimiento en un sistema mecnico. El movimiento entre los dos cuerpos en contacto
causa la disipacin de energa en el sistema. El mecanismo fsico de la disipacin depende de los
materiales de las superficies rugosas, sus acabados, la lubricacin aplicada y otros factores, muchos
de ellos an no son totalmente entendidos.
Lo concerniente a la ingeniera de control no es reducir la friccin sino tratar con esta ya que no
puede ser eliminada. Para compensar la friccin es necesario entender y tener un modelo del
proceso de friccin. Muchos investigadores han estudiado el modelado de la friccin.
Modelos de Friccin Esttica
El modelo clsico de la fuerza de friccin es proporcional a la carga, se resiste al movimiento y es
independiente del rea de contacto lo que era conocido por Leonardo Da Vinci. El modelo de
friccin de Da Vinci fue redescubierto por Coulomb y es ampliamente usado hoy como el ms simple
modelo de friccin, descrito como

F ( ) = ( a ) sgn [ ]
donde

es la velocidad relativa y F ( ) es la correspondiente fuerza de torque. El parmetro a es

tomado generalmente como una constante por simplicidad. La friccin de Coulomb es mostrada en
el Grfico 7.2(a). Un modelo de friccin mas detallado se muestra en el Grfico 7.2(b) el cual incluye
la friccin viscosa, un trmino proporcional a la velocidad.
Experimentos fsicos han mostrado que en muchos casos la fuerza requerida relativa al inicio
del movimiento es ms grande que la fuerza que se opone al movimiento una vez que empieza. Este
efecto es conocido como friccin esttica. El modelo de friccin esttica es complementado con el
uso de una no-linealidad de la forma como se muestra en el Grfico 7.2(c ).
F friccin

F friccin

v velocidad

( a ) Friccin de Coulomb

F friccin

v velocidad

( b ) Friccin de Coulomb y viscosa

MODELOS DE FRICCION

v velocidad

( c ) Modelo completo de Friccin

Grafico 7.2

81

Una frmula emprica a veces usada para expresar la dependencia de la fuerza de friccin con
respecto a la velocidad es:

F ( ) = a be c e + d sgn ( )
en el cual los parmetros

a, b, c y d son escogidos para dar la pendiente deseada ala funcin de

friccin.
Modelos de Friccin Dinmica
Si bien la friccin usualmente se modela como un mapeo esttico discontinuo entre velocidad y
friccin de torque, la cual depende del signo de la velocidad, hay algunas propiedades interesantes
observadas en los sistemas con friccin que no pueden ser explicadas slo por modelos estticos. Esto
es debido bsicamente por el hecho de que la friccin no tiene una respuesta instantnea para un
cambio en la velocidad (es decir tiene una dinmica interna).
Algunos ejemplos de las caracteristicas de la dinmica son:

Movimiento stick-slip, el cual consiste en la oscilacin de un ciclo lmite a bajas velocidades


causada por el hecho que la friccin es ms grande en reposo que durante el movimiento.

Desplazamiento presliding , lo cual significa que la friccin se comporta como resorte cuando la
fuerza aplicada es menor que la fuerza de friccin esttica all de donde empieza.

Retraso friccional lo cual significa que hay histresis en la relacin entre friccin y velocidad.
Todas estas caractersticas de friccin estticas y dinmicas estn contenidas en el modelo

dinmico y el modelo analtico propuesto en Canudas de Wit (1995 ). Este modelo es llamado LuGre.
El modelo LuGre esta dado por:

dz
=q 0 z q
dt
g (q)
g ( q ) = 0 + 1e
F = 0 z + 1
donde

q

0

dz
+ 2q
dt

q es la velocidad angular y F es la fuerza de friccin. La primera de estas ecuaciones

representa la dinmica del estado

z de la friccin interna, la cual describe el promedio relativo a la

defleccin de las superficies de contacto durante las fases de friccin esttica. Este estado no es
medible.
La funcin g ( q ) describe la parte del estado estable del modelo o los movimientos de
velocidad constante:

0 es la velocidad Stribeck, ( 0 + 1 )

es la friccin esttica, y

0 es la friccin

de Coulomb. As el modelo completo de friccin est caracterizado por cuatro parmetros estticos,

0 ,1, 2

asi como dos parmetros dinmicos

1 . El parmetro 0

puede ser entendido


82

como un coeficiente de rigidez de las deformaciones microscpicas de


presliding, mientras que

z durante el desplazamiento

1 es un coeficiente de amortiguamiento asociado con

dz
.
dt

7.c. Friccin en brazos manipuladores


Funcin Friccin en Actuadores
Un modelo completo de friccin adecuado al diseo de controladores industriales est dado en el
modelo de Canudas de Wit en (1991) como:

F ( ) = 0 + 1e

+ 2 1 e

) sgn ( )

donde la friccin de Coulomb esta dada por

2 Nm
de

( Nm ) , la

friccin esttica es

( 0 + 1 ) ( Nm ) , y

seg
representa el modelo de friccin viscoso. El efecto por el cual para pequeos valores
rad

la fuerza de friccin esta decreciendo con respecto a la velocidad es llamada friccin negativa

viscosa. o el efecto Stribeck.

8. CONTROLADOR DE RETROALIMENTACION LINEAL TIPO PD


8.a. Un sistema amortiguado con friccin
Para analizar la naturaleza de los movimientos de las soluciones de una clase de sistemas no-lineales,
utilizamos como ejemplo de un sistema mecnico simple amortiguado con friccin de segundo
orden.

k
m
b

SISTEMA AMORTIGUADO RESORTE-MASA CON FRICCION


Grfico 8.1

La ecuacin que representa el sistema mecnico es

mx + bx + kx = 0 ........................................ (8.1)
83

Aplicando la Transformada de Laplace la ecuacin (8.1) queda

ms 2 + bs + k = 0
Esta ecuacin tiene las races

La ubicacin de

s1 =

b
b 2 4mk
+
2m
2m

s2 =

b
b 2 4mk

2m
2m

s1 y s2 determina los polos del sistema en el plano real-imaginario y dicta la

naturaleza de los movimientos del sistema.

Observaciones:
Caso 1 Raices reales y desiguales. En este caso cuando

b 2 > 4mk , esto es, la friccin

domina y se produce un comportamiento no oscilatorio . Y para que el sistema sea estable debe
cumplirse que

b > b 2 4mk para que las races sean negativas. A esta respuesta se le llama

sobreamortiguado.
Caso 2

Raices complejas. En este caso cuando

b 2 < 4mk ; esto es la rigidez domina y se

produce un comportamiento oscilatorio. A esta respuesta se le llama subamortiguado.


Caso 3 Raices reales e iguales. Este es el caso especial cuando

b 2 = 4mk , aqu la friccin y

rigidez estn balanceadas, lo que produce un comportamiento menos rpido y no oscilatorio . A


esta respuesta se le llama crticamente amortiguada.
El tercer caso amortiguamiento crtico es generalmente una situacin deseable. En los casos en
que uno de los polos tiene una magnitud mucho mayor que la otra, el polo de mayor magnitud
disminuir a cero rpidamente en comparacin con el otro polo dominante. Esta misma nocin de la
dominacin se extiende a los sistemas de mayor orden, por ejemplo a menudo un sistema de tercer
orden puede estudiarse como sistema de segundo orden si se consideran slo dos polos dominantes.
Ejemplo 1 races reales y desiguales
Se desea determinar el movimiento del sistema representado en el esquema anterior Grfico
(8.1) y expresado por la ecuacin (8.1), si los valores de los parmetros son: m = 1 , b = 5 y k = 6 .

x + 5x + 6x = 0
Aplicando Laplace
la cual tiene las races

s 2 + 5s + 6 = 0
s1 = 2 y s1 = 3 , por lo tanto la respuesta tiene la forma

x ( t ) = c1e 2t + c2 e 3t

84

Ahora, con las siguientes condiciones iniciales: x ( 0 ) = 2 , x ' ( 0 ) = 0 nos da la siguiente grfica
de comportamiento del sistema. (ver mayor informacin en programa de Mathemtica,
Amortiguacin 8.1). Ver las Observaciones anteriores.

Desplazamiento

1.5

0.5

t
1

Ejemplo 2 races complejas


Se desea determinar el movimiento del sistema representado en el esquema anterior Grfico
(8.1) y expresado por la ecuacin (8.1), si los valores de los parmetros son: m = 1 , b = 1 y k = 1 .

s2 + s + 1 = 0

La ecuacin caracterstica es
La cual tiene las races

1
3
s1 =
i . Por lo tanto, la respuesta tiene la forma
2 2

3
3
x ( t ) = e c1 cos
t + c2 sen
t
2
2

1
2

Ahora, con las siguientes condiciones iniciales: x ( 0 ) = 2 , x ' ( 0 ) = 0 nos da la siguiente grfica
de comportamiento del sistema. (ver mayor informacin en programa de Mathematica,
Amortiguacin 8.2). Ver las Observaciones anteriores.

Desplazamiento

2
1.5
1
0.5
t
2

10

12

14
85

Ejemplo 3 raices reales e iguales


Se busca determinar el movimiento del sistema representado en el esquema anterior Grfico
(8.1) y expresado por la ecuacin (8.1), si los valores de los parmetros son: m = 1 , b = 4 y k = 4 .
En el caso de races reales e iguales (races repetidas ), la solucin tiene la forma:

x ( t ) = c1es1t + c2tes2t
en donde en este caso

s1 = s2 =

x ( t ) = ( c1 + c2t ) e
La ecuacin caracterstica es
La cual tiene la raz doble

b
, por lo que la ecuacin puede escribirse as
2m

b
t
2m

s 2 + 4s + 4 = 0

s1 = s2 = 2 .

Ahora, con las siguientes condiciones iniciales: x ( 0 ) = 2 , x ' ( 0 ) = 0 nos da la siguiente grfica
de comportamiento del sistema. (ver mayor informacin en programa de Mathematica,
Amortiguacin 8.3). Ver las Observaciones anteriores.

Desplazamiento

1.5

0.5

t
5

10

15

20

25

8.b. Ecuaciones Euler-Lagrange para un brazo robtico


Deduccin de las ecuaciones de movimiento de Euler-Lagrange para un brazo robtico de dos
eslabones con movimiento planar. El brazo est fijo en la base y tiene dos actuadores, uno en cada
una de las articulaciones.

86

Y1

L2

L2 /2
2
L1
articulacin 2

L1/2

X1

1
X

articulacin 1

BRAZO ROBOTICO DE DOS ESLABONES ARTICULADOS

Para el primer eslabn del brazo se considera que las componentes horizontal y vertical de un vector
denotado como scm1 al centro de masa m1 con la longitud del eslabn L1, corresponden a

L1
cos 1
2

L1
sen1 . Para el segundo eslabn del brazo se considera que las componentes
2

horizontal y vertical de un vector denotado como scm2 al centro de masa m2 con la longitud del
eslabn L2, corresponden a

L1cos 1 +

L2
L2
cos 2 y L1sen1 +
sen 2 .
2
2

1
1

scm1 = L1cos (1 ) , L1sen ( 2 )


2
2

1
1

scm2 = L1cos (1 ) + L 2 cos ( 2 ) , L1sen (1 ) + L 2sen ( 2 )


2
2

Derivando con respecto al tiempo los vectores

d
1
1
( scm1) = L1sen (1 )1 , L1cos (1 )1
2
dt
2

d
1
1
1
( scm2 ) = L1sen (1 )1 L2sen ( 2 ) 2 , L1cos (1 )1 + L2 cos ( 2 ) 2
2
2
2
dt

Ahora se determina la energa cintica debida a la traslacin

Ttr1 =

T=

1 2
mv
2

2 1
1
m1( d ( scm1) ) = 12 L12 m1
2
8

87

Ttr 2 =

2
1
1
m2 ( d ( scm2 ) ) = m2 412 L12 + 22 L 22 + 41 2 L1L 2 cos (1 2 )
2
8

Los momentos de inercia son:

I1 =

L12 m1
12

I2 =

L 22 m2
12

A continuacin se determina la energa cintica debida a la rotacin en el sistema

( )

Trot1 =

1
1
I1 12 = 12 ( L12 ) m1
2
24

Trot 2 =

1
1
I 2 22 = 22 ( L 22 ) m2
2
24

( )

La energa cintica total del sistema esta dada por T = Ttr1 + Trot1 + Ttr 2 + Trot 2

1
1
1
T = 12 L12 m1 + 22 L 22 m2 + m2 412 L12 + 22 L 22 + 41 2 ( L1)( L 2 ) cos(1 2
6
24
8
La energa potencial esta expresada por

V=

V = mgh , as en este caso es

1
1

g ( L1)( m1) sen (1 ) + g ( m2 ) ( L1) sen (1 ) + ( L 2 ) sen ( 2 )


2
2

El Lagrangiano (L = T V ) del sistema queda

( )

2
2
2
2
1 2 ( L 2 ) m2 + 1 ( L1 ) ( m1 + 3m2 ) + 31 2 ( L1)( L 2 ) m2 cos (1 2 )
L=

6 3g ( L1( m1 + 2m2 ) sin (1 ) + L 2m2sin ( 2 ) )

Derivando para deducir las ecuaciones de movimiento

L
1
1
= g ( L1)( m1) cos (1 ) g ( L1)( m2 ) cos (1 ) (1 )( 2 )( L1)( L 2 )( m2 ) sen (1 2 )
2
2
1
L
1
1
= g ( L 2 )( m2 ) cos ( 2 ) + (1 )( 2 )( L1)( L 2 )( m2 ) sen (1 2 )
2
2
2
Las ecuaciones de movimiento de Euler-Lagrange quedan como:

d L L 1 21 ( L1) m1 + 61 ( L1) m2 + 3 g ( m1 + 2m2 ) cos (1 )


= L1

dt 1 1 6 +3 2 ( L 2 )( m2 ) cos (1 2 ) + 3 22 ( L 2 )( m2 ) sen (1 2 )
2 2 ( L 2 ) + 31 ( L1) cos (1 2 )

d L L 1
L
2
m
2

+3g cos ( ) 3 2 ( L1) sen ( )


dt 2 2 6
2
1
1
2

considerando los torques de entradas

1 21 ( L1) m1 + 61 ( L1) m2 + 3g ( m1 + 2m2 ) cos (1 )


L1
= 1
6 +3 2 ( L 2 )( m2 ) cos (1 2 ) + 3 22 ( L 2 )( m2 ) sen (1 2 )

88

2 2 ( L 2 ) + 31 ( L1) cos (1 2 )

1
L 2m 2
=
+3g cos ( ) 3 2 ( L1) sen ( ) 2
6
2
1
1
2

y as el Modelo de la Planta considerando la Friccin resulta:

1 21 ( L1) m1 + 61 ( L1) m2 + 3 g ( m1 + 2m2 ) cos (1 )



L1
+ 0 + 1e 1 1
2
6 +3 2 ( L 2 )( m2 ) cos (1 2 ) + 3 2 ( L 2 )( m2 ) sen (1 2 )

+ 2 1 e

2 1

) sgn ( ) =
1

2 2 ( L 2 ) + 31 ( L1) cos (1 2 )

1


+ 0 + 1e 1 2 + 2 1 e 2 2 sgn 2 = 2
L 2m 2

2
+3g cos ( ) 3 ( L1) sen ( )
6
2
1
1
2

( )

8.c. Dinmica del brazo robtico


La dinmica de un robot manipulador de n articulaciones puede ser expresada en la forma EulerLagrange de la siguiente forma matricial:

M ( q ) q + Vm ( q, q ) q + G ( q ) + F ( q ) + d =

......................... (8.2)

con q ( t ) R el vector de juntas variables, M ( q ) la matriz de inercias, Vm ( q, q ) la matriz de fuerzas


n

de coriolis/centrpeta, G ( q ) el vector de gravedad y F ( q ) la fuerza de friccin. Las perturbaciones


desconocidas acotadas ( incluyendo dinmicas no modeladas sin estructurar) son denotadas por
el torque de control de entradas es

d y

(t ) .

Dada una trayectoria deseada del brazo qd ( t ) R el error de seguimiento es


n

e ( t ) = qd ( t ) q ( t ) ............................ (8.3)
En uso estndar para robots el error de seguimiento filtrado es

r = e + e ............................................ (8.4)
donde

= T > 0 es una matriz parmetro de diseo, usualmente seleccionada diagonal.

Diferenciando r ( t ) y usando (8.2), la dinmica del brazo puede escribirse en trminos del error de
seguimiento filtrado como:

Mr = Vm r + f + d ............................ (8.5)
donde la funcin no-lineal del robot es

f ( x ) = M ( q )( qd + e ) + Vm ( q, q )( qd + e ) + G ( q ) + F ( q ) .............. (8.6)
89

y, por ejemplo, podemos seleccionar un vector x de la siguiente manera


T

x = eT , eT , qdT , qdT , qdT ...................................... (8.7)


La funcin

f ( x ) normalmente es desconocida conocida de manera incompleta. Debe ser

computada o compensada por el controlador de retroalimentacin. Hay que notar que f ( x ) es


discontinua ya que contiene trminos de friccin desconocidos.
Definiendo ahora un torque de control de entrada como:

0 = f + K v r
la matriz de ganancia

......................................................... (8.8)

K v = K vT > 0 y

f ( x ) como un estimado de f ( x ) . La estructura de esta

entrada de control es importante ya que determina la estructura del sistema de control por
retroalimentacin. Hay que notar que contiene un trmino de control proporcional derivativo

PD .

K v r = K v e + K v e . (8.9)
El

PD es el control estandar para el diseo lazos cerrados de seguimiento de movimiento para

sistemas industriales. Sin embargo, esto tambin tiene un trmino de compensacin f ( x ) que va a
ser usado para compensar los efectos de no-linealidades desconocidas.
El sistema de control debe de alguna manera proporcionar este estimado f ( x ) . Para verificar
la estabilidad del diseo del controlador hay que examinar la dinmica del lazo cerrado del error que
est dada por:

Mr = ( K v + Vm ) r + f + d ............................(8.9)
donde la funcional de la estimacin del error es:

f = f f ............................... (8.10)
Hay que notar que de acuerdo a (8.4) tenemos

e
1
= ( sI + )
r

As que

e ( sI + )

e
1
= s ( sI + ) . (8.11)
r
1

min ( )

e s ( sI + )

r . (8.12)

e r . (8.13)

90

Con

min ( )

el mnimo valor singular de

. Esto significa que tanto el error de seguimiento e ( t )

como su derivada e ( t ) estn acotadas simplemente por el diseo del control, ecuacin (8.8), de tal
manera que el error filtrado r ( t ) est acotado, reduciendo la complejidad del problema de diseo.

Las siguientes propiedades estndar de la dinmica del robot son requeridas y se mantienen
para cualquier brazo robtico de elementos rgidos que giran.
Propiedad 1: M ( q ) es una matriz simtrica definida positiva acotada por

mi I M ( q ) m2 I
con

m1 , m2 constantes positivas conocidas.

Propiedad 2: Vm ( q, q ) est limitada por


Propiedad 3: La matriz

b ( q ) q

, con

b ( q ) C 1 ( S )

M 2Vm es anti-simtrica.

Propiedad 4: Las perturbaciones desconocidas satisfacen

d < bd , con bd una constante positiva

conocida.

8.d. Diseo del controlador de retroalimentacin lineal tipo PD


Se utiliza para controlar la planta como primera aproximacin un Controlador de Retroalimentacin
Lineal del tipo

PD cuyas siglas significan Proporcional-Derivativo y que es el ms aplicado en la

Industria.
Como primer paso para el anlisis que determina los valores de las ganancias mnimos de

Kpy

K d que se requieren en el Controlador PD , para que logre que la planta alcance una posicin
deseada, para lo cual se toma como ejemplo el sistema de un brazo robtico de un eslabn.
El siguiente es un caso particular de un Brazo Robtico de un eslabn considerando la
horizontal como su eje de referencia. La ecuacin de su movimiento queda representada por:

3.67875cos 1 + 0.1251 =

. (8.d.1)

Posicin deseada
segn el control

PD para una posicin deseada =

Iniciales: posicin =

con velocidad deseada = 0 y con Condiciones

3
y velocidad = 0. Tenemos
2

e = 1d 1
91

r = e + K d (de)
r=

de = 1

1 + K d (1 )

Valores propuestos para

= K p (r ) .. (8.d.2)

K p y Kd

Aqu se considera que el valor de

K p debe ser mayor a V el cual es el coeficiente del trmino de

Coriolis. En este caso particular V = 3.67875 y el valor de


estima un valor de entre 5 y 20% del valor de
ganancias

K d se ajusta a una regla emprica que

K p . Se proponen los siguientes valores para las

K p = 4 y K d = 0.25 y se sustituyen en la ecuacin (8.d.1).

3.67875cos 1 + 0.1251 = 4( 1 0.251 ) (8.d.3)


2
0.1251 = 6.2831 41 1 3.67875cos 1
Simplificando y despejando

se tiene:

1 = 50.2654 321 81 29.43cos 1 . (8.d.4)


ahora se establece un sistema de ecuaciones de estado

1 = x1

1 = x2

x1 = x2
x2 = 32 x1 29.43cos( x1 ) 8 x2 + 50.2654

(8.d.5)(sistema de estado con controlador

PD )

Calculando el Jacobiano del sistema (8.d.5)

0
1

Df =

32 + 29.43sen( x1 ) 8
evaluando en las condiciones deseadas

0
1

Df =
32 + 29.43sen( ) 8

2
Resulta una matriz

A
1
0
A=

2.57 8

La matriz tiene traza negativa y su determinante es positivo, por estas condiciones se trata de punto
sumidero y se deduce que el sistema es estable. Como el sistema anterior es estable el Controlador

PD har que la planta cumpla con las condiciones de posicin y velocidad deseadas.

92

Analisis
Bien, ahora se analizar el porqu de los resultados anteriores. Retomando la ecuacin (8.d.3)

3.67875cos 1 + 0.1251 = K p 1 + K d 1

( )

Cambiando los coeficientes numricos por letras


3.67875cos 1 + 0.1251 = K p K p1 K p K d1
2
b


Kp
a1
b cos 1 K p1 K p K d1
2 el factor a es un escalar que divide toda la
=

+
a
a
a
a
a
ecuacin para simplificar el primer trmino.


Kp
2 K p1 K p K d1 b cos(1 )
1 =
a
a
a
a
ahora se establece un sistema de ecuaciones de estado

1 = x1

1 = x2

x1 = x2

Kp
K x b cos( x1 ) K p K d x2
2
x2 = p 1

+
a
a
a
a
0

Df = bsen

2 Kp

a
a

K p Kd

a
1

bsen( ) K
2 p , a22= K p K d
elementos de la matriz a11=0 , a12 = 1 , a21=
a
a
a
Observaciones
1 El elemento a22 es un polo por lo cual debe ser negativo, para esto

K p y K d deben ser del

mismo signo.
2 Para que la matriz tenga una trayectoria de solucin estable el elemento a21 debe ser
negativo por lo cual la ganancia

K p debe ser positiva y adems se debe cumplir K p > b .


93

3 Por lo tanto

K p y K d siempre deben ser positivas.

4 Una regla emprica indica que el valor de

K d puede estar entre el 5% y el 20% del valor de

Kp.
NOTA RELEVANTE
En robots manipuladores de dos brazos o ms, la Estabilidad Asinttica de manera lineal en todos los
brazos en el sentido estricto, es decir a cero, es una tarea difcil de alcanzar porque aparecen los
trminos compuestos en la ecuacin del sistema debidos a la accin de los brazos un(os) sobre el(los)
otro(s), as que, es mas factible que el sistema alcance la estabilidad en condiciones menos severas.
En puntos de estado de equilibrio, sin perturbaciones, es ms prctico lograr que en el sistema se
logre la convergencia del error de manera oscilante decreciente hasta el grado de precisin
deseado y en otros casos que se alcance un estado estable Acotado Uniforme y Ultimamente UUB .
Para lograr lo dicho anteriormente, los valores de las ganancias

K p requieren estar varias

veces mas arriba de los coeficientes de la Matriz de Coriolis V . El ajuste del acotamiento de la
funcin estar en funcin al grado de precisin que se desee tener.

8.e. Simulaciones y Observaciones.


Se realizaron varios programas en Mathemtica para cubrir los casos que sirven al anlisis. Entre las
variantes se incluye el tener o no friccin, alcanzar una posicin deseada o el seguimiento de
trayectorias de referencia. La parte transitoria queda definida desde el inicio hasta que llega el
sistema al estado estable.

94

Simulacin 8.1.
Brazo con dos eslabones, sin friccin, posicin deseada = vertical eslabones hacia arriba.
Programa de Mathematica PD_2e_SFriccin_posicin
Diagonal K = 20 , Diagonal = 0.5

Angulos

tiempo 15 seg.

1Hrojo L y 2Hazul L

e1Hrojo L y e2Hazul L

Errores

4.5

t
2

10

12

14

-0.5

3.5

-1

3
-1.5

2.5
-2

-2.5

1.5
t
2

e
110 -7
7.5 10

-8

510

-8

2.5 10

-8

Errores

10

12

e1Hrojo L y e2Hazul L

-8

-5 10

-8

1'Hrojo L y 2'Hazul L

t
4

10

12

14

-1

12.5

13

13.5

14

14.5

-2

15
-3
-4

-7.5 10 -8
-1 10

Velocidades
2

t
-2.5 10

-3

14

-7

-5

Observaciones:
Se observa un buen comportamiento transitorio y una buena convergencia del error en el estado
estable, no hay oscilaciones indeseables, se logra una buena precisin al tiempo final con valores a
centsimas de micra de radian. No hay alteraciones indeseables en las velocidades2
2

1.5

1.5

1
1

0.5
0.5

-2

-1.5

-1

-0.5

0.5

1.5

2
-2

-1.5

-1

-0.5

0.5

1.5

-0.5
-0.5

-1
-1

-1.5

-1.5

-2

-2

Grfica de la Simulacin de la trayectoria que sigue el brazo para alcanzar la posicin deseada

95

Simulacin 8.2
Brazo con dos eslabones, sin friccin,

posicin deseada: a 1 radian a partir de la horizontal

Programa de Mathematica PD_2e_SFriccin_posicin_2


Diagonal

K = 900, 200 , Diagonal = 0.35


Angulos 1Hrojo L y 2Hazul L

4.5
e

Errores

e1Hrojo L y e2Hazul L
t

3.5

-0.5

-1

-1.5

2.5

-2

-2.5

1.5

-3

t -3.5
2

e
0.01

Errores

e1Hrojo L y e2Hazul L

Velocidades

1'Hrojo L y 2'Hazul L

t
2

0.0075

-2

0.005

-4

0.0025
t
2

-0.0025
-0.005

-6
-8

-0.0075
-0.01

-10

Observaciones:
Se observa un buen comportamiento en la seccin transitoria. El sistema alcanza un estado estable
acotado, con una precisin del error a milsimas de radian.
ganancias que se incrementan

El controlador

sustancialmente respecto al

PD tiene valores de las

ejemplo anterior,ya que debe

mantenerse en esta posicin que no es un punto de equilibrio.

96

Simulacin 8.3
Brazo con dos eslabones, sin friccin, seguimiento de trayectoria de referencia I, la roseta
Programa de Mathematica PD_2e_SFriccin_trayectoria_I
Diagonal

K = 600,350 , Diagonal = 0.7


Angulos

error 1Hrojo L y error 2Hazul L

1Hrojo L y 2Hazul L

10

-1
3

-2
2

-3
1

-4
2

10

error 1Hrojo L y error 2Hazul L

Velocidades

1'Hrojo L y 2'Hazul L

0.04

2
0.02

t
2

10

-2
2
-0.02

10

-4
-6

-0.04

Observaciones:
Se observa un buen comportamiento transitorio con ondulaciones suaves. El sistema converge al
estado Estable Acotado Uniforme y ltimo y se logra una precisin a milsimas de radin. Las
velocidades no presentan anormalidades a este grado de precisin. No puede reducirse el margen
de error en este tipo de seguimiento de trayectoria sin que se presenten alteraciones en las
velocidades.

97

Simulacin 8.4
Brazo con dos eslabones, sin friccin, seguimiento de trayectoria de referencia Seno-Coseno
Programa de Mathematica PD_SFriccin_tray.Seno-Coseno_Aprox.Final

K = 82000,14000 , Diagonal = 0.003


Angulos

error 1Hrojo L y error 2Hazul L

Rojo 1 y Azul 2
0.0001

1
0.00008
0.5
0.00006
2

10

12

14

0.00004

-0.5

0.00002

-1
2

error 1Hrojo L y error 2Hazul L


0.0001

0.00008

Velocidades

10

12

14

1'Hrojo L y 2'Hazul L

0.75
0.5

0.00006
0.25
t

0.00004

10

12

14

-0.25

0.00002

-0.5
-0.75

11

12

13

14

15

-1

Observaciones:
En esta simulacin se reduce el margen de error a diezmilsimas de radian ajustando los valores de las
ganancias. Como no tiene perturbaciones modela sin alteraciones las funciones de referencia.

98

Simulacin 8.5
Brazo con dos eslabones, con friccin, posicin deseada arriba.
Programa de Mathematica PD_2e_CFriccin_posicin
Diagonal K = 7000 , Diagonal = 0.35

Angulos

Error 1Hrojo L y Error 2Hazul L

1Hrojo L y 2Hazul L

2.1

-0.5
1

-1

1.9

-1.5

1.8

-2

1.7

-2.5

1.6

-3

Error 1Hrojo L y Error 2Hazul L


1

Velocidades

-0.0025

1Hrojo L y 2Hazul L

-2

-0.005
-0.0075

-4

-0.01
-0.0125

-6

-0.015
-0.0175

-8

-0.02

Observaciones
Para tener una convergencia a milsimas de radin fue necesario incrementar mucho el valor del
coeficiente de ganancia

K ; esto porque hay mantener una posicin y rechazar el efecto de la

friccin. Se alcanza una Estabilidad Acotada Uniforme y ltima, aunque slo por un lapso de hasta
10 seg., despus se vuelve inestable.

99

Simulacin 8.6
Brazo con dos eslabones, Con Friccin, seguimiento de trayectoria de referencia II.
Programa de Mathematica PD_2e_CFriccin_trayectoria_II
Diagonal K = 920 , Diagonal = 0.25

error 1Hrojo L y error 2Hazul L

Angulos 1Hrojo L y 2Hazul L

2
4

10

12

14

-1

-2
2

-3

10

12

-4

14

-1

error 1Hrojo L y error 2Hazul L


0.1

1Hrojo L y 2Hazul L

Velocidades

0.05

10

12

14

-2.5
-5

10

11

12

13

14

15

-7.5
-10

-0.05

-12.5
-15

-0.1

-17.5

Observaciones:
La precisin del seguimiento alcanzada a poco menos de 5 centsimas de radian no es adecuada
sin embargo evidencia que empiezan a aparecer anormalidades en la grfica de velocidades lo
cual indica que no modela las no linealidades causadas por la perturbacin.
Observando la grfica del error, por la forma que adquiere, nos indica que el Controlador PD no
modela la perturbacin de la friccin, slo la rechaza, conforme al nivel de seguimiento que le es
posible alcanzar.

100

Simulacin 8.7
Brazo con dos eslabones, Con Friccin, seguimiento de trayectoria de referencia II.
Programa de Mathematica PD_CFriccin_tray.Seno-Coseno_Aprox.Final
Diagonal K = 450000 , Diagonal = 0.0003
Angulos

1Hrojo L y 2Hazul L

1
0.75
0.5
0.25
2

10

12

14

-0.25
-0.5
-0.75
-1

error 1Hrojo L y error 2Hazul L

0.0001

0.0001

0.000075

0.000075

0.00005

0.00005

0.000025

0.000025
2

10

12

-0.000025

14

9
-0.00005

-0.000075

-0.000075

-0.0001

-0.0001
1Hrojo L y 2Hazul L

10

11

12

13

14

15

-0.000025

-0.00005

Velocidades

error 1Hrojo L y error 2Hazul L

Velocidades

1Hrojo L y 2Hazul L

1
0.75

1.5

0.5
1

0.25
0.5

10

11

12

13

14

15

-0.25
2

-0.5
-1

10

12

14

-0.5
-0.75
-1

Observaciones:
Al llegar a esta tolerancia del error el Controlador PD produce zonas crticas que muestran debilidad
en el sistema que pueden llegar a ocasionar inestabilidad. Las grficas del error muestran que no
modela las no linealidades de la friccin, solo las rechaza. Se presentan alteraciones en determinados
puntos en las grficas del error y de las velocidades donde la no linealidad de la friccin se presenta.

101

9. CONTROLADOR PD Y RED NEURONAL


9.a. Estructura del controlador PD y red neuronal
Ahora se deriva un controlador de Red Neuronal para la dinmica del robot definida anteriormente.
Se propone el algoritmo de ajuste de pesos usual de retropropagacin. Se ver que con el ajuste de
retropropagacin la Red Neuronal slo puede garantizar el adecuado funcionamiento en lazo
cerrado bajo condiciones ideales (no realistas). Un algoritmo de ajuste modificado es propuesto mas
adelante en el siguiente inciso, para el funcionamiento del controlador de Red Neuronal bajo
condiciones realistas. As, se supone que la funcin no-lineal del robot expresada por la ecuacin (8.6)

f ( x ) = M ( q )( qd + e ) + Vm ( q, q )( qd + e ) + G ( q ) + F ( q ) .................(8.6)
es dada por una Red Neuronal como en la ecuacin (9.1) para algunas constantes de pesos
ideales la Red Neuronal en W y V .

f ( x ) = W T (V T x ) + ( x ) ...................... (9.1)
Donde la reconstruccin del error por la red

( x ) esta

limitada por una constante conocida

N .

menos de que la red sea mnima, los pesos adecuados ideales no pueden ser nicos. Los mejores
pesos pueden entonces ser definidos como aquellos que minimizan el supremo de la norma de

( x ) sobre S .

Este resultado no es la mejor propuesta, como nosotros solo necesitamos saber que

tales pesos ideales existen; sus valores actuales no se requieren.


De acuerdo al Teorema 6.d.A este supuesto de aproximacin suave siempre se mantiene para
funciones continuas.

y = W T (V T x ) . (6.b.3)
Teorema 6.d.A
Sea

N1 = n , N 3 = m y sea cualquier funcin de aplastamiento. Entonces el rango funcional de la

Red Neuronal , ecuacin (6.b.3), es denso en C

(S ) .

Esto es en severo contraste con el caso para el control adaptativo donde los supuestos de
aproximacin tales como

LIP , linealidad-en-los-parmetros, no se pueden conservar. La suavidad

de este supuesto es la principal ventaja para el uso de redes no-lineales multicapas sobre las redes
lineales de dos capas. Por conveniencia de notacin se define la matriz de todos los pesos como:

W 0
Z =
......................................... (9.2)
0 V

102

Los dos primeros supuestos sern verdaderos en cada situacin prctica, y son usuales en la literatura
existente. Los hechos son fciles de probar dados los supuestos.
Supuesto 1: Los

VM , W
Z

con

pesos

ideales estn acotados

por valores positivos conocidos as que

WM o

Z M .............................................................. (9.3)

Z M conocido.

Supuesto 2: La trayectoria deseada esta limitada en el sentido, por ejemplo,

qd
qd Qd ........................................... (9.4)
qd
donde

Qd R es una constante conocida.

Hecho 3: Para cada tiempo t , x ( t ) dado por la ecuacin (8.7)


T

x = eT , eT , qdT , qdT , qdT ...................................... (8.7)


esta acotada por

x c1Qd + c2 r ................................ (9.5)


para constantes positivas computables

ci ( c2 decrece cuando aumenta ).

Sean V , W algunos estimados de valores de pesos ideales, como los provistos, por ejemplo por
algoritmos de ajuste de pesos que sern presentados. Se definen las derivaciones de los pesos o los
errores de estimacin de pesos como:

V = V V , W = W W , Z = Z Z .............................. (9.6)
y el error de salida de la capa oculta para una x dada como:

( ) ............................................. (9.7)

= (V T x ) V T x

La expansin de las series de Taylor para una x dada puede ser escrita como:

(V T x ) = V T x + V T x V T x + O (V T x )
con

( z )

Denotando

.................... (9.8)

d ( z )
2
y O ( z ) denotando trminos de segundo orden.
dz z = z

( ) tenemos:

= V T x

103

2
2
= V T x V T x + O (V T x ) = V T x + O (V T x ) ................... (9.9)

Se pueden tomar diferentes rdenes de la serie de Taylor dependiendo como se escoja para

(i) .

Ntese que tomamos el siguiente:

O VTx

= (V T x ) V T x V T x V T x ....................... (9.10)

Estructura del Controlador y Dinmica del Sistema de Error


Se define el estimado funcional de la Red Neuronal de (8.6) por

( )

f ( x ) = W T V T x ...................................................................... (9.11)
con V , W los valores actualizados ( estimados )

de los pesos ideales de la Red Neuronal

V , W provistos por los algoritmos de ajuste que mas adelante sern discutidos.
Con

definido en (8.8)

0 = f + K v r

......................................................... (8.8)

se selecciona la entrada de control

( )

= 0 v = W T V T x + K v r v

............................................. (9.12)

con v ( t ) una funcin que ser detallada mas adelante y que provee de robustez en el
enfrentamiento con los trminos de alto orden de la serie de Taylor. La propuesta estructura de
control con Red Neuronal se muestra en el Grfico 9.1 donde

q qT , qT , e eT , eT .

qd

q= q
(x)

e= e
e

r
[

KV

ROBOT

qd = qd
qd

CONTROLADOR PD Y RED NEURONAL


Caso Ideal
Grfico 9.1

104

Usando este controlador, la dinmica del error filtrado en lazo cerrado se convierte en.

( )

Mr = ( K v + Vm ) r + W T (V T x ) W T V T x + ( + d ) + v
Adicionando y sustrayendo

W T se produce:

Mr = ( K v + Vm ) r + W T + W T + ( + d ) + v
con y

T
definida en (9.7). Adicionando y sustrayendo ahora W nos da

Mr = ( K v + Vm ) r + W T + W T + W T + ( + d ) + v ........................... (9.13)
El paso clave est en el uso ahora de las series de aproximacin de Taylor (9.9) para

de acuerdo

con el cual el sistema del error en lazo cerrado es

Mr = ( K v + Vm ) r + W T + W T V T x + w1 + v ........................................... (9.14)
donde los trminos de perturbacin son

w1 (t ) = W T V T x + W T O V T x + ( + d ) ................................................... (9.15)
2

Desafortunadamente, usando este sistema del error no se produce un conjunto compacto exterior en
el cual una cierta funcin derivada de Lyapunov es negativa. Por lo tanto finalmente escribimos el
sistema del error como:

Mr = ( K v + Vm ) r + W T V T x + W T V T x + w + v ( K v + Vm ) r + 1 ................. (9.16)
donde los trminos de perturbacin son:

w(t ) = W T V T x + W T O V T x + ( + d ) ..................................................... (9.17)


2

Es importante hacer notar que

( x)

el error de reconstruccin de la Red Neuronal,

las

perturbaciones del robot, y los trminos de las series de expansin de Taylor de alto orden, todos
tienen exactamente la misma influencia como perturbaciones en el sistema de error. El siguiente lmite
clave es requerido. La importancia esta en permitirle a uno sobre-acotar w ( t ) en cada paso para
cada funcin computable conocida. Siguiendo algunas inequidades de normas usuales.
Hecho 4: El trmino de perturbacin (9.17) est acotado de acuerdo a

w ( t ) ( N + bd + c3 Z M ) + c6 Z M Z
o
con

w ( t ) c0 + c1 Z

+ c2 Z

+ c7 Z M z

r ...................................... (9.18)

ci constantes positivas conocidas computables.

105

Actualizacin de Pesos
Ahora se dan algunos algoritmos de ajuste de pesos de Redes Neuronales que garantizan la
estabilidad del seguimiento del sistema de lazo cerrado bajo varias supuestos. Se requiere demostrar
que el error de seguimiento r ( t ) es adecuadamente pequeo y que los pesos de la Red Neuronal

V , W permanecen acotados, por lo cual el control ( t ) est acotado.

Las caractersticas clave

de todos estos algoritmos son que la estabilidad est garantizada, no hay fase de aprendizaje fuera
de lnea as que el control de la Red Neuronal comienza inmediatamente, y que los pesos de la Red
Neuronal son fciles de inicializar sin el requerimiento de estabilizacin inicial de pesos.

9.b. Reglas de ajuste de pesos


Caso Ideal ajuste de pesos por retropropagacin:
El siguiente resultado detalla el funcionamiento del lazo cerrado en un cierto caso idealizado que
demanda:
1) No hay error en la reconstruccin funcional de la red;
2) No hay perturbaciones no modeladas en la dinmica del brazo robtico;
3) No hay trminos de series de Taylor de alto orden.
Teorema 9.A
Sea que la trayectoria deseada este acotada y supngase que el trmino de perturbacin w1 ( t ) en
(9.14) es igual a cero.

Mr = ( K v + Vm ) r + W T + W T V T x + w1 + v ........................................... (9.14)
Sea que la entrada de control para (8.2) la dada por (9.12) con v ( t ) = 0

M ( q ) q + Vm ( q, q ) q + G ( q ) + F ( q ) + d = ......................... (8.2)

( )

= 0 v = W T V T x + K v r v

............................................. (9.12)

y el ajuste de pesos proporcionado por:

W = F r T ................................................. (9.19)

....................................... (9.20)
V = Gx T Wr
y con cualesquiera matrices constantes definidas positivas

F , G . Entonces el error de seguimiento

r ( t ) va a cero con t y los estimados de pesos V , W estn acotados.

106

Demostracin:
Se define una funcin de Lyapunov candidata

W TW
r T Mr
+ tr
L=
2F
2

) + tr (V V ) ............................... (9.21)
T

2G

Diferencindola produce:

L = r T Mr +

W TW
r T Mr
+ tr
F
2

V TV
+
tr

De aqu que haciendo sustitucin de (9.14) ( con

L = r K v r +
T

r T ( M 2Vm ) r

w1 = 0, v = 0 ) se produzca

V
W

+ tr W T + r T + tr V T + xr TW T
F

La propiedad anti-simtrica hace el segundo trmino cero, y ya que W = W W con W constante,


as que

dW
dW
( y as de manera similar para V ), las reglas de ajuste producen
=
dt
dt
L = r T K v r

Ya que L > 0 , y

L 0 esto muestra estabilidad en el sentido de Lyapunov as que r , V y W (y aqu

mismo V , W ) estn acotados. Adems

Ldt < ..................................... (9.22)

La extensin de LaSalle se usa ahora para mostrar que r ( t ) en efecto va a cero. La limitacin de

garantiza la acotacin de e y e , de aqu que la acotacin de la trayectoria deseada muestra que

q, q y x estn acotacin. La propiedad 2 entonces muestra las acotacin de Vm ( q, q ) . Ahora


L = 2r T K v r y la acotacin de M 1 ( q ) y de todas las seales sobre el lado derecho de (9.14)
verifica la acotacin de

L , y de ah la uniforme continuidad de L . Esto le permite a uno utilizar el

Lema de Barbalat en conexin con (9.22) para concluir que

L va a cero con t , y as como r ( t )

tiende a cero.
Propiedad 2: Vm ( q, q ) est limitada por

b ( q ) q

, con

b ( q ) C 1 ( S )

Hay que notar que el problema de la red de inicializacin de pesos que esta ocurriendo en otras
aproximaciones aqu no aparece. En efecto, seleccionando los pesos

W ( 0 ) ,V ( 0 ) en cero toma la

Red Neuronal fuera del circuito y deja solamente el lazo de seguimiento exterior.
107

Es bien sabido que el trmino

K v r del PD en (9.12) puede estabilizar la planta sobre una base

interna. Una demostracin formal revela que


pequeo. El valor exacto de

K v debe ser bastante grande y el error filtrado bastante

K v , necesario para la estabilizacin inicial est dado en (8.4), pensando

en propsitos prcticos es slo necesario seleccionar

K v grande.

r = e + e ............................................ (8.4)
Hay que notar que (9.19) y (9.20) no son nada mas que la versin en tiempo continuo del algoritmo de
retropropagacin. En el caso de la sigmoidal escalar, por ejemplo

( z ) = ( z ) (1 ( z ) ) ................................... 3.(37)
as que

= V T x 1 V T x Wr
................................ 3.(38)
T Wr

el cual es el error filtrado pesado por la estimacin actual W y multiplicado por el usual producto que
involucra las salidas de la capa oculta.
El Teorema 9.A indica cuando la retropropagacin sola debe ser suficiente, a saber, cuando la
perturbacin w1 ( t ) es igual a cero. Observando el primer trmino en (9.17) revela que esta es una
fuerte suposicin mas que la simple linealizacin de la funcin del robot f ( x ) en (8.5).

w(t ) = W T V T x + W T O V T x + ( + d ) ..................................................... (9.17)


2

Mr = Vm r + f + d ............................ (8.5)
Esto es an cuando

( x ) = 0, d = 0

y f ( x ) es lineal, el ajuste por retropropagacin no est

garantizado el lograr el exitoso seguimiento de la trayectoria deseada. Ntese que f ( x ) es lineal


slo en el caso del brazo robtico de una articulacin. La suposicin w1 ( t ) = 0 , significa, mas an,
que la Red Neuronal puede aproximar exactamente la funcin sobre todo el espacio

R n . Esta es una

fuerte suposicin. La falla de la retropropagacin simple en el caso general. En efecto en el caso de


la Red Neuronal de dos capas V = I ( es decir, lineal en los parmetros ), es fcil mostrar que, usando
la regla de actualizacin (9.19), los pesos de
salida

( x)

W no son generalmente acotados a menos que la

de la capa oculta obedezca a un estricta condicin de PE (exitacin persistente).

En el caso de tres capas ( no-lineal ), las condiciones

PE no son fciles de derivar como lo que se

muestra con las propiedades de observabilidad de un cierto sistema bilineal. As que, la


retropropagacin usada en una red que no puede reconstruir exactamente f ( x ) , o sobre un brazo
robtico con acotadas perturbaciones no-modeladas, o cuando

f ( x ) es no-lineal, no puede

garantizar producir pesos acotados en los sistemas de lazo cerrado.


108

9.c Simulaciones y Observaciones


Simulacin 9.1
Brazo con dos eslabones, Sin Friccin, posicin deseada: 1 radian a partir de la horizontal
Programa de Mathematica PD+RN_SFriccin_posicin_2
Diagonal K = 8, Diagonal = 2 Nmero de Neuronas: 6, Diagonal T = 10, Diagonal S =10
Angulos

Error Rojo 1 y Error Azul 2

Rojo 1 y Azul 2

3
2.5

2
1.5

1
2

0.5
1

10

-0.5
2

10

-1

Error Rojo 1 y Error Azul 2


0.0001
0.000075
0.00005
0.000025
6.5

7.5

8.5

9.5

10

-0.000025
-0.00005
-0.000075
-0.0001
2

Velocidad
2

de 1 Rojo ; Velocidad
4

de 2 Azul
8

1.5

10
1

-2

-4

0.5

-2

-1.5

-1

-0.5

0.5

1.5

-0.5

-6

-1

-1.5

-8
-2

Observaciones:
Este tipo de Controlador en este caso logra una excelente aproximacin de la posicin con un error
que se reduce a micras de radian en el tiempo asignado. Esto se logra con una Red Neuronal de 6
neuronas y un controlador PD con valores pequeos de las ganancias.La grafica de velocidades no
presenta anormalidades. El sistema tiende a una estabilidad asinttica presentndose suaves
oscilaciones decrecientes.
109

Simulacin 9.2
Brazo con dos eslabones, Con friccin

posicin: a 1 radian de la horizontal

Programa de Mathematica PD+RN_CFriccin_posicin_2


Diagonal K = 18, Diagonal = 0.6 Nmero de Neuronas: 6, Diagonal T = 10, Diagonal S =10

Error Rojo 1 y Error Azul 2

Angulos Rojo 1 y Azul 2

4
4

3
3

2
2

1
1

2
2

10

12

10

12

14

-1

14

Velocidad
Error Rojo 1 y Error Azul 2

de 1 Rojo ; Velocidad

de 2 Azul

0.001
0.00075

0.0005

10

12

14

-1

0.00025

-2
11.5

12

12.5

13

13.5

14

14.5

15

-0.00025

-3

-0.0005

-4

-0.00075
-0.001

-5

Observaciones:
Con este tipo de Controlador se logra una buena aproximacin a la posicin deseada con un error
que se reduce a diezmilsinas

de radian. La perturbacin por la friccin esta rechazada. Las

velocidades no presentan alteraciones drsticas.


Los valores de las ganancias que se requieren son bajos y se utilizan matrices diagonales
simtricas con valores igualesNo se puede asegurar que se comporte asintticamente estable por un largo tiempo mas all
del estipulado en el programa, debido a la accin permanente de la friccin y la retroalimentacin.

110

Simulacin 9.3
Brazo con dos eslabones, Sin Friccin, Trayectoria de referencia:

1 = Sin[t ], 2 = Cos[t ]

Programa de Mathematica PD+RN_SFriccin_Aprox.1


Diagonal K = 30,Diagonal = 5 Nmero de Neuronas: 10, Diagonal T = 30, Diagonal S =30
Angulos

Rojo 1 y Azul 2

1.5
1
0.5

10

-0.5
-1
-1.5
Velocidad

Error Rojo 1 y Error Azul 2

de 1 Rojo ; Velocidad

de 2 Azul

0.2

1
0.1

0.5

10

12

14

-0.1

10

12

14

-0.5
-1

-0.2

Observaciones:
Aqu se presenta el resultado de una primera aproximacin a la trayectoria de referencia con un
valor del error considerado alto (a dcimas de radin). El seguimiento inicia en un punto no slo
cercano, sino que perteneciente a la funcin de referencia, esto para que se apliquen teoremas
referentes a la convergencia del error de seguimiento y estabilidad del sistema. Las grficas del error y
de las velocidades no presentan alteraciones.

111

Simulacin 9.4
Brazo con dos eslabones, sin friccin, Trayectoria de referencia:

1 = Sin[t ], 2 = Cos[t ]

Programa de Mathematica PD+RN_SFriccin_traySC_Aprox.Final


Diagonal K = 380,Diagonal = 10300 Nmero Neuronas: 10, Diagonal T = 30, Diagonal S =30

Angulos Rojo 1 y Azul 2


1

0.5

10

12

14

-0.5

-1
Error Rojo 1 y Error Azul 2
0.0002

Velocidad

0.00015

de 1 Rojo ; Velocidad

de 2 Azul

0.0001
0.00005

0.5

10

12

14

-0.00005

-0.0001

10

12

14

-0.5

-0.00015
-1

-0.0002

Observaciones:
En esta segunda aproximacin al seguimiento de trayectoria de referencia. Se alcanza un tolerancia
del error de una diezmilsima de radian. El sistema llega un estado Estable Acotado Uniforme y ltimo

UUB . En las grficas del error y la velocidad se conservan las caractersticas de las funciones de
referencia lo cual indica que an puede seguir reducindose el tamao arbitrario del error
incrementando nicamente la ganancia

112

Simulacin 9.5
Brazo con dos eslabones, Con friccin, Trayectoria de referencia:

1 = Sin[t ], 2 = Cos[t ]

Programa de Mathematica PD+RN_CFriccin_Aprox.1


Diagonal K = 30, Diagonal = 5 Nmero de Neuronas: 10, Diagonal T = 30, Diagonal S =30

Rojo 1 y Azul 2

Angulos
1
0.5

10

-0.5
-1
Error Rojo 1 y Error Azul 2
0.2

de 1 Rojo ; Velocidad

Velocidad
1

de 2 Azul

0.75

0.1

0.5
0.25

10

10

-0.25

-0.1

-0.5
-0.75
-1

-0.2

Observaciones:
Se presenta una aproximacin al seguimiento de la trayectoria de referencia que permite observar
que el sistema

con

Controlador

PD

Red Neuronal que se actualiza por retropropagacin

solamente, no modela la perturbacin ocasionada por la friccin ya que se presentan no linealidades


pronunciadas en los cambios de direccin de las pendientes, localizadas en la parte media de las
sinuosidades principalmente.
Aunque el Controlador no modela bien los puntos donde se acenta la friccin; si modela la
trayectoria que debe seguir, esto se observa en la grfica de los errores donde estos tienen la formas
de la funciones que deben seguir. Las no-linealidades de la friccin no son modeladas, slo son
rechazadas.

113

Simulacin 9.6
Brazo con dos eslabones, Con friccin, Trayectoria de referencia:

1 = Sin[t ], 2 = Cos[t ]

Programa de Mathematica PD+RN_CFriccin_traySC_Aprox.Final


Diagonal K = 380, Diagonal = 10000 Nmero Neuronas: 10, Diagonal T = 30, Diagonal S =30

Angulos

Rojo 1 y Azul 2

0.5

10

12

14

-0.5

-1
Error Rojo 1 y Error Azul 2
Velocidad
1

0.0001

de 1 Rojo ; Velocidad

de 2 Azul

0.75

0.00005

0.5
0.25

10

12

14

10

12

14

-0.25

-0.00005

-0.5
-0.75

-0.0001

-1

Observaciones:
En esta segunda aproximacin al seguimiento de trayectoria de referencia. Se alcanza un
tolerancia del error de una diezmilsima de radian. El sistema llega un estado Estable Acotado
Uniforme y ltimo UUB .
En las grficas del error y la velocidad se conservan las caractersticas de las funciones de
referencia lo cual indica que an puede seguir reducindose el tamao arbitrario del error
incrementando nicamente la ganancia

Las no-linealidades causadas por la perturbacin de la friccin a este nivel de precisin no


aparecen; son absorbidas por el sistema adaptativo y la retropropagacin, sin embargo como se
indica en el inciso 9 esto no siempre se puede garantizar.
114

10. CONTROLADOR PD Y RED NEURONAL AUMENTADA ROBUSTA


10.a. Ampliacin de la red neuronal

10.a.1. Redes Neuronales para aproximacin de funciones con discontinuidades


Como se vi antes la aparicin de la no linealidad de la friccin en actuadores es discontinua en el
origen. Una de las ms importantes propiedades de las Redes Neuronales RNs para propsitos de
control es la propiedad de aproximacin universal. Desafortunadamente, esta propiedad es
generalmente probada como en el inciso anterior para funciones continuas. Sin embargo en la
mayora de los sistemas de control industrial reales hay funciones que no son suaves ( es decir,
continuas por partes ) para las cuales los resultados de aproximacin en la literatura son escasos.
Se ha encontrado en los intentos por aproximar tramos de funciones continuas usando
funciones de activacin suaves que se requieren muchos nodos en la capa oculta de la Red
Neuronal y muchas iteraciones de entrenamiento y an as no producen muy buenos resultados.
El resultado principal en esta seccin es un Teorema para funciones continuas por partes o
funciones con saltos. Se ha encontrado que para aproximar tales funciones adecuadamente, es
necesario aumentar la Red estandar que usa funciones de activacin suaves con nodos extras
conteniendo un cierto conjunto bsico de aproximacin funciones de salto de funciones de
activacin no suaves. Esta novedosa estructura de Red Neuronal Aumentada permite la
aproximacin de tramos de funciones continuas del tipo que aparecen en las no-linealidades del
actuador que controla el movimiento.
La red neuronal aumentada consiste de neuronas teniendo funciones de activacin
sigmoidales estandar ms algunas neuronas adicionales teniendo una clase especial de funciones
de activacin no suaves llamada funciones bsicas de aproximacin de funciones con salto. Esta
Red Neuronal Aumentada con neuronas adicionales puede aproximar cualquier tramo de funcin
continua con discontinuidades en un nmero finito de puntos conocidos.
En adicin a funciones sigmoidales continuas uno requiere un conjunto de funciones bsicas
discontinuas. Se tienen dos conjuntos adecuados, las funciones de aproximacin de salto
polinomiales y las funciones de aproximacin de salto sigmoideas.
Teorema 10.1 Aproximacin de tramos de funciones continuas
Sea dada cualquier funcin acotada

f : S esto es continua y analtica sobre un conjunto

compacto S excepto en x = c , donde la funcin


derecha. Entonces dado cualquier

>0

existe una suma

f tiene un salto finito y es continua por la


F de la forma

115

F ( x ) = g ( x ) + ak f k ( x c ) . (10.1)
k =0

tal que

F ( x ) f ( x ) < . (10.2)

para cada x en S donde g ( i ) es una funcin en C


de salto polinomiales

(S )

y las funciones bsicas de aproximacin

f k estn definidas como:

0....... para..x < 0

.(10.3)
fk ( x ) = xk
..... para..x 0
k!
Las funciones bsicas de aproximacin de salto polinomiales f k tienen un defecto al usarse en control
por retroalimentacin y es que no estn acotadas. Esto puede producir inestabilidades no acotadas
en un conjunto de funciones bsicas que estn acotadas. Se desprende el resultado principal que
nos permite reemplazar el conjunto bsico de aproximacin de salto polinomial por sigmoideas
discontinuas.
Lema 10.A

Funciones de aproximacin de salto sigmoideas

Cualquier combinacin lineal de funciones de aproximacin de salto polinomiales f k ,

N
k =0

ak f k ( x )

puede ser representada como:


N

k =0

k =0

ak f k ( x ) = z ( x ) + bkk ( x ) . (10.4)
Donde las funciones de aproximacin de salto sigmoideas

estn definidas como:

0.............. para...x < 0


. (10.5)
x k
1

e
......
para
...
x

0
(
)

k ( x ) =

Y donde z ( x ) es una funcin que pertenece a C

(S ) .

Demostracin.
Es suficientes con probar que existen coeficientes bk tales que las primeras N derivadas de la
N

expresin

a f ( x ) b ( x ) (10.6)
k =0

k =0

son continuas.
Para x < 0 , esta expresin tiene un valor constante cero. Por lo tanto, uno debe mostrar que existen
coeficientes bi tales que para x > 0 , las primeras N derivadas de la expresin son iguales a cero.
116

Para x > 0 , uno tiene


N

k =0

k =0

k =0

ak f k ( x ) bkk ( x ) = ak

k
xk N
bk (1 e x )
k ! k =0

Usando la frmula binomial uno puede expander esta expresin en:


N

ak
k =0

i
xk N k k
bk ( e x )
k ! k =0 i =0 i

= ak
k =0

xk N k k
i
bk ( 1) ( e ix )
k ! k =0 i =0 i

ix )
(
xk N k k
i
= ak
bk ( 1)

k ! k =0 i =0 i
j !
k =0
j =0
N

= ak
k =0
N

= ak
k =0
N

= ak
k =0

xk N k k
i
j x
bk ( 1) ( 1)
k ! k =0 i =0 i
j!
j =0
j
xk N k k
i
j x
bk ( 1) ( 1)
k ! k =0 i =0 j =0 i
j!
j
xk N k k
i
j x
bk ( 1) ( 1)
k ! j =0 k =0 i =0 i
j!

k
m
xk N m
i
k x
= ak
bm ( 1) ( 1)
k ! k =0 m =0 i =0 i
k!
k =0
N

Con el fin de que las primeras N derivadas de la expresin (10.6) sean cero, los coeficientes de

x k para k = 0,1,..., N deben ser cero en esta ecuacin. Por lo tanto, se requiere que:
N m
m
i
k
ak bm ( 1) ( i ) = 0
m=0 i =0
i
N
m
m
i
k
ak bm ( 1) ( i ) = 0
m=0
i =0 i

Usando el Lema tcnico el cual dice que


m

i =0

i ( 1) ( i )
i

=0

Para cada m > k , uno obtiene


k
m
m
i
k
ak bm ( 1) ( i ) = 0
m=0
i =0 i

Para k = 1, 2,..., N o

117

k
k 1
m
k
m
i
k
i
k
ak bk ( 1) ( i ) bm ( 1) ( i ) = 0
i =0 i
m =0
i =0 i

Para

k = 1, 2,..., N . Por lo tanto, uno obtiene la relacin recurrente para los coeficientes
k 1
m
m
i
k
ak bm ( 1) ( i )
m=0
i =0 i
bk =
k
k
i
k

( 1) ( i )
i =0 i

Para k = 1, 2,..., N y con b0 = a0 . Q.E.D.

Las funciones de aproximacin de salto sigmoideas

para k = 0,1, 2,3 tienen una mayor ventaja

sobre los conjuntos de base polinomial en el diseo del control por retroalimentacin ya que las
primeras estn acotadas.
El siguiente resultado importante se desprende directamente. El uso de conjuntos base de
aproximacin de salto sigmoideas para funciones de aproximacin de salto en las Redes Neuronales.
Teorema 10.2 Resultados de aproximacin con red neuronal general para funciones con saltos
Sea que hay una funcin acotada dada

f : S , la cual es continua y analtica sobre un conjunto

compacto S excepto en x = c , donde la funcin


derecha. Dado cualquier

f tiene un salto finito y es continua por la

> 0 , existe una suma F de la forma


L

k =0

k =0

F ( x ) = ak ( mk x + nk ) + akk ( x c ) . (10.7)
tal que

F ( x ) f ( x ) < . (10.8)

para cada x en S donde

( x)

es una funcin sigmoidea estandar y

k ( i ) son

las funciones de

aproximacin de salto sigmoideas.

Este Teorema muestra que cualquier funcin con saltos puede ser aproximada por una Red Neuronal
estandar teniendo sigmoidales continuas estandar (el primer trmino de (10.7)) mas funciones de salto
sigmoidales discontinuas ( el segundo trmino de (10.7)).
Se puede mostrar, que en vez de utilizar las funciones de aproximacin de salto sigmoideas,
ecuaciones (10.5) se pueden usar Funciones de Aproximacin de Salto Sigma

0........... para...x < 0

k ( x ) = 1 e x k
.. (10.9)
....
para
..
x

0
1 + e x

118

O funciones bsicas de salto basadas en Tangente Hiperblica

0........... para...x < 0

k ( x ) = e x e x k
. (10.10)
e x + e x .... para..x 0

10.a.2. Red neuronal aumentada en el controlador


Aqu se presenta la estructura y los algoritmos de entrenamiento derivados para la Red Neuronal
Multicapa Aumentada. Esta RN aumentada es capaz de aproximar funciones con saltos,
considerando que los puntos de discontinuidad son conocidos. Ya que los puntos de discontinuidad
son conocidos en muchas caractersticas no lineales de sistemas de movimiento industrial ( es decir, el
modelo de friccin es discontinuo en cero, la inversa zona muerta es discontinua en cero, etc.) esta
RN aumentada es una herramienta til para la compensacin de los efectos parsitos y nolinealidades de actuadores sistemas de control industrial.
La capa aumentada de RN es mostrada en la figura 10.1.

Uno puede ver que la Red

Neuronal Aumentada es una combinacin de una Red Neuronal estandar ( con funciones de
activacin estandar
discontinuas

k .

( ) )

mas algunas neuronas extra con funciones de activacin sigma

Comparando la Red Neuronal Aumentada con la Red Neuronal Estandar uno

puede ver que la primera tiene dos conjuntos de funciones de activacin en la capa oculta,
T

dos conjuntos de pesos para la primera capa, V1


T

y V2

k ,

y dos conjuntos de pesos de la segunda

capa W1 y W2 . Con esta estructura la Red Neuronal tiene:

y = w11 ( v11 x1 + v10 ) + w12 ( v 21 x1 + v 20 ) + w10 . (10.11)


L

=1

=1

De manera similar como en el caso de Red Neuronal estandar, la salida de la Red Neuronal
Aumentada est dada por una matriz de la forma:

y = W1T (V1T x ) + W2T (V2T x) . (10.12)


Si las funciones de activacin de la capa oculta
toma las funciones bsicas de salto
esta

Red

Neuronal

aumentada

est definida como las sigmoideas, uno

como en (10.5), Entonces se usa el Teorema 10.2 que dice que

puede

aproximar

cualquier

funcin

con

un

salto

finito,

proporcionando la localizacin del salto.


Los algoritmos de ajuste estandar de la Red Neuronal deben ser modificados ya que la
T

estructura de la Red ha sido cambiada. El conjunto de los pesos de la segunda capa W1 y W2 son
entrenados en la forma usual de las Redes Neuronales Multicapa, ambas son tratadas de la misma
T

manera incluyendo los pesos de los sesgos. Los pesos de la primera capa V1 son actualizados en la
forma usual de las Redes ( es decir, aproximacin por retropropagacin ). Sin embargo los pesos de
119

V2T y el sesgo, estn fijos y seleccionados para que correspondan a los puntos de discontinuidad del
salto. Efectivamente la porcin de aproximacin del salto de la Red Neuronal Aumentada es una Red
de una capa, ya que tiene solamente una capa simple de pesos ajustables.

1
1

V1T
s

W1T

j1

V2T

W2T

j2
c
c
1

jN

Red Neuronal Multicapa Aumentada


Figura 10.1
1

1
0.8

0.8

0.6

0.6

0.4

0.4

0.2

0.2

10

0.8

0.8

0.6

0.6

0.4

0.4

0.2

0.2

4
6
0,1,2

10

10

10

Grficas funciones de activacin llamadas Funciones de Aproximacin de Salto Sigma


Figura 10.2

120

10.b. Control adaptativo robusto en la red neuronal


En la planta libre-de perturbaciones, el objetivo era disear un controlador adaptativo estable que
asegurara un seguimiento-del modelo asinttico. En la presencia de perturbaciones, el seguimientodel modelo exacto ya no es posible, y el objetivo es disear un controlador que asegure mrgenes en
todas las seales del sistema y satisfaga especificaciones de ejecucin.
Nuevas aproximaciones son necesarias para asegurar la limitacin de todas las seales en el
sistema y dando lugar a un cuerpo de trabajo llamado Teora de Control Adaptativo Robusto.
Robustez en este sentido implica que el sistema adaptativo se desempee esencialmente de la
misma manera, an cuando perturbaciones exgenas o endgenas estn presentes.
El Caso General: Para enfrentar la estabilidad y la ejecucin del seguimiento de un controlador
de brazo robtico de Red Neuronal en el difcil caso general, requerimos:
1. La modificacin de las reglas de ajuste de los pesos y
2. La inclusin de un trmino que da robustez v ( t ) .
El problema en este caso es que, pensando que no es difcil concluir que r ( t ) esta acotado, es
imposible sin estas modificaciones mostrar que los pesos de las Redes Neuronales estn acotados en
general.

La limitacin de los pesos es necesaria para verificar que el control de entradas

( t ) permanece acotado.
El siguiente Teorema se considera como una extensin de la teora de Lyapunov. La
perturbacin

d , el error de reconstruccin

de la Red Neuronal, y la no-linealidad de f ( x ) hace

imposible mostrar que la derivada de Lyapunov L es no-positiva para toda r ( t ) y valores de pesos.
En efecto, slo posible mostrar que L es negativa en el exterior de un conjunto compacto en el
espacio de estado. Esto, sin embargo, permite concluir la limitacin del seguimiento del error y de los
pesos de la Red Neuronal. De hecho, los lmites explcitos son descubiertos durante la demostracin.
La requerida extensin de Lyapunov es la ltima parte de la demostracin.
Teorema 10.3 Actualizacin de Pesos con trminos de robustez
Sea que la trayectoria deseada este acotada por (9.4).

qd
qd Qd ........................................... (9.4)
qd
Tmese el control de entradas de (8.2) en (9.12)

M ( q ) q + Vm ( q, q ) q + G ( q ) + F ( q ) + d =

......................... (8.2)

121

( )

= 0 v = W T V T x + K v r v

............................................. (9.12)

con un trmino de robustez:

v ( t ) = K Z Z

+ Z M r ....................................................... (10.13)

K z > C2 ........................................................ (10.14)

y la ganancia

con C2 la constante conocida en (9.18)

w ( t ) c0 + c1 Z

+ c2 Z

r ...................................... (9.18)

Sea el ajuste de pesos de la Red Neuronal el proporcionado por:

W = F r T F V T xr T kF r W .................................... (10.15)

V = Gx T Wr

kG r V ................................................ (10.16)

con cualesquiera matrices constantes

F = F T > 0 , G = GT > 0 y un parmetro de diseo escalar

k > 0 . Entonces para un control de ganancia K v bastante grande, el error de seguimiento filtrado
r ( t ) y los estimados de pesos V , W de la Red Neuronal estn UUB , con los lmites prcticos dados
especficamente por los lados derechos de (10.17) y (10.18). Ms an, el error de seguimiento puede
ser conservado tan pequeo como se desee por el incremento de la ganancia K v en (9.12).

= 0 v = W T V T x + K v r v

............................................. (9.12)

Demostracin: Sea la propiedad de aproximacin (6.d.4) mantenida con una precisin


dada

para toda x en el conjunto compacto U x x x bx

} con b

> c1Qd en (9.5).

f ( x ) = W T (V T x ) + ( x ) ................... (6.d.4)
x c1Qd + c2 r ................................ (9.5)

Se define U r = r r

bx c1Qd
. Sea r ( 0 ) U r . Entonces la propiedad de aproximacin se
c2

mantiene.
Seleccionando ahora la funcin de Lyapunov (9.21), diferenciando y sustituyendo ahora para el
sistema de error (9.13) se produce

W TW
r T Mr
L=
+ tr
2F
2

) + tr (V V ) ............................... (9.21)
T

2G

Mr = ( K v + Vm ) r + W T + W T + W T + ( + d ) + v ........................... (9.13)
122

L = r K v r +
T

r T ( M 2Vm ) r

W
+ trW T
F

+ r T V T xr T + trV T + xr T W T + r T ( w + v )

Las reglas de ajuste dan:

(
)
(
(Z Z ) + r ( w + v)

L = r T K v r + k r trW T W W + k r trV T V V + r T ( w + v ) =
r T K v r + k r trZ T
ya que trZ

(Z Z ) =

Z, Z

L K v min r + k r Z

(Z

K v min r + k r z

(Z

+ r C0 + C1 Z

+ C2 Z

(Z

r K v min r + k Z

) K ( Z
) K ( Z
Z

+ ZM
+ ZM

aqu resulta

)r
)r

+ r w

Z M C0 C1 Z

donde K v min es el mnimo valor singular de K v y la ltima desigualdad se mantiene debido a

K z > C2 .(10.14)
As, L es negativa tan grande como el trmino entre parntesis es positivo.
Definiendo C3 = Z M +

K v min r + k Z

k Z

(Z

C1
y acompletando el cuadrado resulta:
k

C2 C0 =

C kC 2
3 3 + K v min r C0
2
4

la cual es garantizada positiva tan grande como

kC32
+ C0
r > 4
br ................................................. (10.17)
K v min
o

donde

>

C3
C32 C0
+
+
bz ..................................... (10.18)
k
2
4

C3 = Z M +

C1
............................................... (10.19)
k

As que, L es un conjunto compacto exterior negativo. La forma del lado derecho de (10.17)
muestra que la ganancia de control K v puede ser seleccionada lo bastante grande para que
123

br <

( bz C1Qd ) .
C2

Entonces

cualquier

trayectoria

r ( t ) empezando en U r y evolucionando

completamente dentro de U r . De acuerdo con una extensin del Teorema de Lyapunov estandar se
demuestra que la UUB de ambas r y Z

Hay que hacer algunas observaciones con respecto a esto:

Primera. Ya que cualquier curso de r o de Z

mas all de los lmites dados en (10.17) y (10.18)

respectivamente, se dirigen a una disminucin en la funcin L de Lyapunov, se deprende que el


lado derecho de (10.17) y (10.18) pueden ser tomados como lmites prcticos de

respectivamente, en el sentido de que las normas sern restringidas a estos valores mas

cualquier arbitrariamente pequeo

para

> 0.

Una comparacin con los resultados para control adaptativo muestra que en

el error de

reconstruccin para Redes Neuronales, las perturbaciones limitadas bd y los trminos de alto orden de
la serie de Taylor, todos se encuentran involucrados en las constantes C0 y C3 incrementando los
lmites sobre

r y Z

de una manera muy interesante. Ntese de (10.17), sin embargo, que los

lmites de un error de seguimiento arbitrariamente pequeo pueden ser alcanzados por la seleccin
de una ganancia de control grande K v . (Si K v es tomado como una matriz diagonal, K v min es
simplemente el elemento ganancia mas pequeo). Por otra parte (10.18) revela que los errores de
pesos de la Red Neuronal estn fundamentalmente limitados por Z M (continuo hasta C3 ). El
parmetro k ofrece un intercambio en el diseo relativo entre las posibles magnitudes de r y Z

Los primeros trminos de (10.15) y (10.16) no son nada mas que el algoritmo de
retropropagacin estandar. Los ltimos trminos corresponden a la modificacin- e con el uso
estandar de control adaptivo para garantizar estimaciones de parmetros acotadas; ellos forman
una clase especial de trminos en la actualizacin de pesos.
El segundo trmino en (10.15) es nuevo y merece discusin.
Los trminos de retropropagacin estandar pueden ser pensados como seales propagadas
con retraso en una Red Neuronal de retropropagacin no-lineal que contiene multiplicadores. El
segundo trmino en 3.(41) es visto como correspondiente a una onda que viaja hacia delante en la
124

red de retropropagacin que proporciona una correccin de segundo orden para el ajuste de pesos
de W .
Ntese que hay libertad de diseo en el grado de complejidad de la Red Neuronal (es decir,
tamao). Para una mayor complejidad de la Red Neuronal ( es decir, mas neuronas en la capa
oculta ) las constantes de limitacin disminuirn, resultando errores de seguimiento mas pequeos.
Por otra parte, Una Red Neuronal simplificada con pocas neuronas en la capa oculta trae
consigo un lmite del error mas grande, esta degradacin puede ser compensada para, tan grande
como la cota

es conocida, se selecciona un valor grande para K z en la seal de robustez v ( t ) ,

o para en (8.4).

r = e + e ............................................ (8.4)

qd

q= q
q

(x)

e= e
e

r
[

ROBOT

KV

qd = qd
qd

Trmino
Robusto

v(t)

CONTROLADOR PD y RED NEURONAL


con trmino robusto
figura 10.3

125

z1

w(t)

Error del Robot :

Mr + ( K v + Vm ) r

z2

W T V T x

-v(t)

Ajuste de

Ajuste de V

Trmino Robusto

Sistema del error en lazo cerrado de la Red Neuronal


Figura 10.4

10.c. Control por pasividad en la red neuronal


Algunas nociones de estabilidad son necesarias para proceder. Consideremos el sistema no-lineal.

x = f ( x, u , t )
y = h ( x, t )
Con el estado x ( t )

. Decimos que la solucin es uniformemente ltimamente acotada ( UUB )

si existe un conjunto compacto

U R n tal que para toda x ( t0 ) = x0 U , existe un > 0 y un

nmero T ( , x0 ) tal que x ( t ) < para toda t t0 + T . Como puede verse en la demostracin de
los teoremas, el conjunto compacto U , esta relacionado con el conjunto compacto en el cual la
propiedad de aproximacin de la Red Neuronal (ecuacin 6.d.4 ) se mantiene. Hay que notar que U
puede hacerse mas grande si se seleccionan mas neuronas en la capa oculta.

f ( x ) = W T (V T x ) + ( x ) ................... (6.d.4)

126

Algunos aspectos de pasividad sern importantes subsecuentemente. Un sistema con entrada u ( t ) y


salida y ( t ) se dice que es pasivo si se verifica una ecuacin de la llamada forma de poder.

L ( t ) = yT u g ( t ) ........................................ (10.20)
Con L ( t ) acotada por abajo y g ( t ) 0 . Esto es

y T ( )u ( ) d g ( )d 2 ............ (10.21)
T

para toda T 0 y alguna

Se dice que es sistema es disipativo si este es pasivo y en adicin

yT ( )u ( ) d 0 implica que

g ( )d > 0 ....................... (10.22)


0

Una clase especial de disipatividad ocurre si g ( t ) es una llamada funcin cuadrtica de x , con
coeficientes limitados, donde x ( t ) es el estado interno del sistema. Se llama a este estado de
pasividad estricta. Entonces la

norma L2 del estado esta acotada por arriba en trminos del

producto interno L2 de la salida y entrada (es decir, el poder entregado para el sistema). Esto se usa
provechosamente para concluir sobre algunas propiedades de limitaciones internas del sistema sin los
supuestos usuales de observabilidad (es decir, persistencia de excitacin, estabilidad, etc.)

El sistema del error en lazo cerrado que aparece en la figura 10.4, con la seal

definida

como:

2 ( t ) = W T

2 ( t ) = W T V T x

para el sistema del error (9.14)

para el sistema del error (9.16).............................(10.23)

Mr = ( K v + Vm ) r + W T + W T V T x + w1 + v ...................... (9.14)

Mr = ( K v + Vm ) r + W T V T x + W T V T x + w + v ( K v + Vm ) r + 1 ..... (9.16)
En el caso formal, la seal w ( t ) debe ser reemplazada por w1 ( t ) . Hay que notar el funcionamiento
de la Red Neuronal, el cual esta descompuesto en dos bloques efectivos apareciendo en una
configuracin de retroalimentacin tpica, en contraste con el funcionamiento de la Red Neuronal
del controlador en la figura 10.3.
La pasividad es importante en un sistema de lazo cerrado como garanta de la acotacin de
seales y de un adecuado funcionamiento, an en la presencia de perturbaciones imprevistas
adicionales tan grandes como sean pero acotadas. En general una Red Neuronal no puede
garantizar ser pasiva. Sin embargo los siguientes resultados muestran que los algoritmos de ajuste de
127

pesos aqu hacen de hecho garantizar propiedades de pasividad deseable de la Red Neuronal y
asimismo del sistema en lazo cerrado.
El primer resultado es considerando el sistema de error (9.14)
Teorema 10.4

Algoritmos de ajuste de pesos Pasivos

Los algoritmos de ajuste de pesos por retropropagacin

W = F r T ................................................. (9.19)

....................................... (9.20)
V = Gx T Wr
(9.19) y (9.20) hacen el primer mapeo de r ( t ) a

W T , y el segundo mapeo de r ( t ) a W T V T x ,

ambos mapeos pasivos.

Demostracin:
Las dinmicas con respecto a W , V son

W = F r T ............................... (10.24)

.................... (10.25)
V = Gx T Wr
1) Seleccionando la funcin no-negativa

W TW
L = tr

2F
y evaluando L a lo largo de las trayectorias de (10.24) se produce

W TW
L = tr
F

= tr W T r T = r T W T

el cual es en Forma de Poder (10.20).


2)

Seleccionando la funcin no-negativa

V TV
L = tr

2G
y evaluando L a lo largo de las trayectorias de (10.25) produce

V TV
L = tr
G

= tr V T x T Wr

) = r ( W V x )
T

la cual est en Forma de Poder


As, el sistema de error del robot en la figura 10.4 es Estado Estrictamente Pasivo ( SSP ) y los
bloques de los errores de pesos son pasivos, esto garantiza la disipatividad de el sistema de lazo
128

cerrado. Usando el Teorema de Pasividad uno puede ahora concluir que las seales entrada-salida
de cada bloque estn acotadas tanto como las entradas externas estn limitadas.
Desafortunadamente, aunque disipativo, el sistema de lazo cerrado no es SSP as que, cuando
la perturbacin w1 ( t ) es no cero entonces no se producen limitaciones de los estados internos de los
bloques de peso (es decir, W , V ) a menos que estos bloques sean observables, esto es, excitado
persistentemente ( PE ). Desafortunadamente, esto no produce un mtodo conveniente para definir

PE en Redes Neuronales de tres capas, como los dos bloques ajustadores de pesos estn
acoplados, formando de hecho un sistema bilineal. Por contraste, las condiciones PE para el caso
de dos capas V = I (es decir Red Neuronal lineal) son fciles de deducir.
El siguiente resultado muestra porqu una condicin

PE no es necesaria con el algoritmo de

actualizacin de pesos modificada del Teorema 10.3. Esto es en el contexto del sistema de error
(9.16).

Mr = ( K v + Vm ) r + W T V T x + W T V T x + w + v ( K v + Vm ) r + 1 ..... (9.16)
Teorema 10.5

Algoritmos de ajuste de pesos modificados SSP

Los algoritmos de ajuste de pesos modificados (10.15), (10.16) hacen el mapeo de r ( t ) a

W T V T x , y el mapeo de r ( t ) a W T V T x ambos mapeos SSP .


Demostracin: La dinmica revisada relativa a W , V estn dadas por:

W = F r T + F V T xr T + kF r W .................................... (10.26)

V = Gx T Wr
1)

+ kG r V ................................................ (10.27)

Seleccionando la funcin no-negativa

W TW
L = tr

2F
y calculando L resulta

W TW
L = tr
F

= tr W T V T x r T + k r W T W

( (W W )) = W ,W

ya que tr W

L r T W T V T x k r

r T W T V T x k r

(W

(W

2
F

W
2
F

2
F

WM W

W
F

2
F

resulta que

el cual est en Forma de Poder con la ltima funcin cuadrtica en W

129

2)

Seleccionando la funcin no-negativa

V TV
L = tr

2G
y calculando L resulta

V TV
L = tr
G

T
= r W T V T x k r

r T W T V T x k r

(V

2
F

(V

VM V

2
F

V ,V

la cual est en Forma de Poder con la ltima funcin cuadrtica en V

Estas son exactamente las formas especiales de L que le permiten a uno mostrar el
acotamiento de

W y de V cuando los primeros trminos (entradas de poder) estn acotadas, como

en la demostracin del Teorema 10.3.


Se debe notar que el SSP de ambos, la dinmica del robot y el ajuste de pesos de los bloques
garantizan SSP para el sistema en lazo cerrado, as que las normas de los estados internos estn
limitadas en trminos del poder liberado para cada bloque. Entonces el acotamiento de las seales
de entrada-salida asegura la limitacin de los estados sin ninguna otra clase de requerimientos de
observabilidad.
Definimos una Red Neuronal como Pasiva si, en la formulacin del error se garantiza la pasividad
de los subsistemas de ajuste de pesos. Entonces una condicin

PE extra es necesaria para garantizar

acotacin de los pesos. Definimos una Red Neuronal como Robusta si, en la formulacin del error, se
garantiza el SSP del subsistema de ajuste de pesos. Entonces no es necesaria una condicin extra de

PE para la acotacin de los pesos.


Hay que notar que:
1. El SSP del sistema de error de la planta en lazo abierto es necesario agregar para la
estabilizacin del seguimiento y
2. Las propiedades de Pasividad de la Red Neuronal dependen del algoritmo de ajuste de
pesos usados.

130

10.d. Controlador final PD y red neuronal con redes aumentadas


10.d.1. Aproximacin de la Red Neuronal y la No-linealidad en el problema de Parmetros
Aqu se presenta un controlador de red neuronal basado en una aproximacin del error filtrado y
empleando una red neuronal aumentada para aproximar las funciones no-lineales desconocidas
(10.28) en la dinmica del brazo robtico, la cual incluye friccin.

( )

= 0 v = W1T V1T x + W2T (V2T x ) + K r v

.......................................(10.28)

Una seria deficiencia en el uso de controladores estandar adaptativos en robots es el


requerimiento de linealidad en los parmetros desconocidos del sistema ( LIP , Linealidad en los
Parmetros desconocidos del sistema ). El LIP restringe severamente la clase de sistemas industriales
que pueden ser controlados, y adems no considera friccin. La restriccin de

LIP se supera usando

la propiedad universal de aproximacin de las redes neuronales la cual se mantiene para funciones
no-lineales generales. El principal objetivo aqu va a ser el el diseo de un controlador como el de la
figura 10.3 pero modificado por la compensacin de la friccin. En vez de requerir el conocimiento de
la estructura del sistema, actuando como en un control adaptativo, una red neuronal es usada para
aproximar la dinmica no modelada. El uso de la red neuronal aumentada da al controlador un
mejor desempeo si hay una friccin considerable desconocida, ya que la friccin es discontinua en
cero.
Para probar la estabilidad de todo el sistema de lazo cerrado, algunos supuestos que se toman
en las situaciones prcticas son requeridos.
Supuesto 1. Trayectoria de referencia limitada.
La trayectoria deseada esta limitada asi que

qd ( t )

qd ( t ) qB ..............(c.14)
qd ( t )

con qB un lmite escalar conocido

Teorema 10.6. La entrada x esta acotada


Para cada tiempo t , x ( t ) esta limitada por

x c1 + c2 r 2qB + c0 r ( 0 ) + c2 r ...........................(10.29 )
para constantes positivas computables c0 , c1 , c2

Demostracin
131

La solucin del sistema

LIP (8.4) con el vector de valor inicial q ( t0 ) es:


r = e + e ............................................ (8.4)

e ( t ) = e0

( t t0 )

( t )

r ( ) d

t t0

t0

donde e0 = qd ( t0 ) q ( t0 )

e e0 +
con

min ( )

As

min ( )

el valor singular mnimo de

. La entrada de la red neuronal puede ser escrita como:

q e qd


q r + e qd
x = qd = qd + 0 ........................................................... (10.30)


qd qd 0
q q
0
d
d

Entonces un lmite puede ser dado como

x (1 + max ( ) ) e + 2qB + r

( )
1
(1 + max ( ) ) e0 + 2qB + 1 +
+ max
r
min ( ) min ( )
= c1 + c2 r

con

c1 = 1 + max ( ) e0 + 2qB
c2 = 1 +

min ( )

max ( )
min ( )

ahora considerando la expresin (8.13) uno tiene e <

c0 =

min ( )

para todo t . De aqu se obtiene que

1 + max ( )
min ( )

La funcin no-lineal del robot f ( x ) es una funcin discontinua debida a la friccin.

f ( x ) = M ( q )( qd + e ) + Vm ( q, q )( qd + e ) + G ( q ) + F ( q, q ) (10.31)
Mas an, esta funcin es desconocida y debe estimarse por el sistema de control tanto que pueda
ser compensada por este. Usando la propiedad universal de aproximacin de las redes neuronales y
los resultados para la aproximacin de funciones con salto, hay una red de dos capas tal que:
132

f ( x ) = W1T (V1T x ) + W2T (V2T x ) + ( x) ............................................ (10.32)


con la aproximacin del error limitada a un conjunto compacto por

( x) < N ,

con

N un

lmite

conocido.
Siendo W1 , W2 , V1 y V2 los pesos objetivo ideales que dan una buena aproximacin de f ( x ) .
Ellos son desconocidos y pueden no ser nicos. De cualquier modo es requerido que estos existan. En
la derivacin del controlador de red neuronal, entonces se muestra como el ajuste los pesos de las
redes neuronales se puedan acercar lo bastante a los pesos ideales.
Se definen W1 , W2 , V1 y V2 como estimaciones de los pesos ideales de las redes neuronales, los
T

cuales los cuales son dados por los algoritmos de ajuste de las redes. Ya que los pesos de V2 estn
dados por el diseo dependiendo de la localizacin del salto, entonces V2 = V2
T

Se definen las

estimaciones del error como:

W1 = W1 W1 , W2 = W2 W2

V1 = V1 V1 .............................. (10.33)

La aproximacin de funciones no-lineales como en (10.31) es:

f ( x ) = W1T V1T x + W2T (V2T x ) ..................................................... (10.34)


Sea Z la matriz de todos los pesos ajustados de la red

W1 0 0

Z = 0 W2 0 ................................................. (10.35)
0 0 V
1

Se debe notar que los pesos de V2 no estn incluidos en (10.35) ya que estos son conocidos y se
seleccionan de acuerdo a la localizacin conocida del salto, la cual ocurre en el origen para la
friccin.
Se requiere hacer el siguiente supuesto, el cual siempre se mantiene. Es simplemente establecer
que se pueden seleccionar en un nmero bastante grande para cubrir los lmites de los desconocidos
pesos ideales de la red.
Supuesto 2. Acotacin de los pesos objetivo ideales de la red neuronal
Sobre cualquier subconjunto compacto de los pesos ideales de la red estn limitados tanto como
n

Z B ............................................................. (10.36)

con Z B conocido
Ahora se mostrar como superar el problema

LIP , el cual comnmente ha restringido el

desempeo de los algoritmos de ajuste del control adaptativo para sistemas que son LIP . La red
133

neuronal es no lineal en los parmetros ajustables, ya que los pesos ajustados V1 estn en los
argumentos de las funciones de activacin no lineales.
Se define el error de salida de la capa oculta para un vector x dado como:

( ) .......................................... (10.37)

= (V1T x ) V1T x
Usando las series de Taylor, se tiene:

( )

( )

2
(V1T x ) = V1T x + ' V1T x V1T x + O (V1T x ) .........................

donde

'

denota la primer derivada y O V1 x

importancia de esta ecuacin es que esta reemplaza

(10.38)

representa los trminos de alto orden. La

la cual es no-lineal en V1 por una expresin

lineal en V1 mas los trminos de alto orden. El Jacobiano

( ) es computable en trminos de

' V1T x

seales medidas x ( t ) y las actualizaciones de los pesos de V1 .


Es mostrado por Lewis, Yesildirek y Lu (1996) que los trminos de alto orden en (10.38) estan
limitados por:

0 V1T x

c3 + c4 qB V1

+ c5 V1

r .................................................(10.39)

para algunas constantes c3 , c4 , c5

10.d.2. Estructura del controlador y dinmica del sistema de error


La entrada de control para el robot manipulador es seleccionada como:

( )

= 0 v = W1T V1T x + W2T (V2T x ) + K v r v


donde el torque

0 (t )

.......................................(10.40)

est definido por (8.8).

0 = f + K v r

......................................................... (8.8)

La estimacin de la funcin no-lineal ha sido proporcionada por la red neuronal como en (10.34).

f ( x ) = W1T V1T x + W2T (V2T x ) ......................(10.34)

La funcin

(t )

es un trmino que robustece que va a ser seleccionado mas tarde para ayudar a

garantizar la estabilidad de el sistema en lazo cerrado. La estructura de este controlador de red


neuronal se muestra en la Figura 10.3. El neurocontrolador es un sistema de control retroalimentado
multilazo, con un lazo de seguimiento

PD exterior, y un lazo interno de red neuronal que compensar

las no-linealidades desconocidas, incluyendo la friccin.

Este lazo interno que cancela las no-

134

linealidades desconocidas por la estimacin de ellas es conocido como un lazo de linealizacin


retroalimentado.
La dinmica del error en lazo cerrado es usada para demostrar la estabilidad, est dado por:

Mr = ( K v + Vm ) r + W1T (V1T x ) + W2T (V2T x ) W1T V1T x W2T (V2T x ) + + d + .... (10.41)
Usando (10.37) se tiene

Mr = ( K v + Vm ) r + W1T + W1T + W2T + + d + ...................................(10.42)


Aplicando la aproximacin con series de Taylor para

, se puede obtener la expresin para la

dinmica del error en lazo cerrado.

Mr = ( K v + Vm ) r + W1T 'V1T x + W1T 'V1T x + W2T + + ..............(10.43)


El trmino de perturbaciones viene de los trminos de mas alto orden en las series de Taylor y esta
dado por:
2
= W1T 'V1T x + W1T O (V1T x ) + + d ....................................... (10.44)

se muestra en Lewis, Yesildirek y Lu (1996) que este trmino por perturbacin esta limitado por:

( t ) C0 + C1 Z

+ C2 Z

r ............................................... (10.45)

con ci constantes positivas conocidas

10.d.3. ajuste de pesos de la red neuronal y anlisis de estabilidad


La estructura del controlador de red neuronal esta dado en la Figura 10.3. Se necesita mostrar como
ajustar los pesos de la red neuronal de tal manera que la estabilidad en lazo cerrado est
garantizada. Se usarn las leyes de ajuste de pesos de redes neuronales, derivadas de la teora de
Lyapunov, que garantizan el seguimiento estable con estabilidad interna. Se muestra que el error de
seguimiento es convenientemente pequeo, los pesos de las redes neuronales son limitados y el
control

(t )

esta acotado. Los pesos de las redes son ajustados en lnea (on line) en tiempo real, sin

ser requerido el aprendizaje preliminar.


El siguiente supuesto especifica la regin de convergencia del controlador neuronal de dos
capas.
Supuesto 3. Requerimientos de condiciones iniciales.
Se supone que la trayectoria deseada qd , qd , qd esta limitada por qB como en el Supuesto 1.
Se definen las constantes conocidas c0 , c2 por el Lema siguiente. Sea la propiedad de aproximacin
de Redes Neuronales

f ( x ) = W1T (V1T x ) + W2T (V2T x ) + ( x) ............................................ (10.32)


135

tomada para la funcin desconocida f ( x ) dada en

f ( x ) = M ( q )( qd + e ) + Vm ( q, q )( qd + e ) + G ( q ) + F ( q, q ) (10.31)
con una exactitud dada por

para toda x en un conjunto compacto

S x = x x < bx

con

( b qB ) Sea r 0 S .

bx > qB . Se define S r = r r < x


( ) r

( c0 + c2 )

El conjunto Sr especifica el conjunto de los errores de seguimiento iniciales permitidos r ( 0 ) .


La idea es que el robot deba iniciar en un punto posicionado bastante cerca de la trayectoria
deseada. Hay que notar que la exactitud de la aproximacin de las redes neuronales determina la
magnitud permitida del error de seguimiento inicial r ( 0 ) . Para una Red Neuronal mas grande (es
decir con mas unidades en la capa oculta)

es pequea para un radio mas grande de bx ; as el

conjunto de condiciones iniciales permitidas S r es mas grande. La clave del rol de las condiciones
iniciales requeridas esta en presentar la dependencia del conjunto de las condiciones iniciales

Sr sobre los parmetros de diseo. Las constantes qB , c0 , c2 y bx no necesitan ser explcitamente


determinadas.
Una caracterstica clave del requerimiento de condiciones iniciales es la independencia de los
pesos iniciales de la red neuronal. Esto en contraste con otras tcnicas donde las demostraciones de
estabilidad dependen de la seleccin de algunos pesos iniciales estabilizantes de la red neuronal, lo
cual es muy difcil de hacer.
El siguiente resultado principal muestra como seleccionar el trmino robustecedor v ( t ) y el
ajuste de la red de tal manera que muestre que el sistema en lazo cerrado es estable. Muestra que el
error de seguimiento es UUB (acotacin ltima uniforme). Este resultado completa el diseo de la
compensacin de la friccin del neurocontrolador. Se muestra que el algoritmo de ajuste por
retropropagacin estndar debe se modificado para sistemas de control con retroalimentacin.
Teorema 10.7 Ajuste de pesos con retropropagacin aumentada
Sea la trayectoria deseada limitada por qB como en el Supuesto 1 y el error inicial de seguimiento

r ( 0 ) satisface la condicin inicial del Supuesto 3. Sean los pesos objetivo ideales, limitados como en
el Supuesto 2. Tmese la entrada de control para la dinmica del robot como

( )

= 0 = W1T V1T x + W2T (V2T x ) + K v r

en (10.40)

................(10.40)

con una ganancia que satisfaga

136

K v min

kC32
C
+
0
( C0 + C2 )
4

......................................... (10.46)
>
bx qB

donde c3 est definido en la demostracin y c0 est definido en (10.45). Sea el trmino robustecedor

v ( t ) = K z Z

+ Z B r ................................................ (10.47)

con ganancia

K z > C2 ................................................................. (10.48)


Sea el ajuste de pesos de la red neuronal aumentada proporcionado por

W1 = S r T S 'V1T xr T kS r W1 ................................ (10.49)


V1 = Txr T W1T ' kT r V1

............................................ (10.50)

W2 = E r T kE r W2

............................................. (10.51)

con cualesquiera matrices constantes S = S > 0 , T = T


T

> 0 , E = E T > 0 y k > 0 un parmetro

()

de diseo con escalar pequeo. Entonces el error de seguimiento filtrado r t

y los pesos estimados

de la red neuronal V1 , W1 y W2 son UUB con lmites dados por (10.52) y (10.53). Adems el error de
seguimiento puede ser conservado tan pequeo como se desee por el incremento de las ganancias

K v en (10.40)
Demostracin:
Seleccionando una funcin de Lyapunov como:

L=

1 T
1
1
1
r Mr + tr W1T S 1W1 + tr V1TT 1V1 + tr W2T E 1W2
2
2
2
2

Derivndola

1
1
1
1
L = r T Mr + r T Mr + tr W1T S 1W1 + tr V1TT 1V1 + tr W2T E 1W2
2
2
2
2

Asumiendo que el error de seguimiento inicial satisface la condicin inicial del Supuesto 3 incluyendo
la dinmica de error del sistema (10.43) se tiene que:

L = r T ( K + Vm ) r + r T W1T 'V1T x + r T W1T 'V1T x + r TW2T

) (

) (

1
+ r T + r T + r T Mr + tr W1T S 1W1 + tr V1TT 1V1 + tr W2T E 1W2
2

Usando la propiedad 3 de la dinmica del robot y las reglas de ajuste se produce:


137

)}
{ (
{ (
+ k r tr {W (W W )} + r ( + )
= r K r + k r tr {Z ( Z Z )} + r ( + )

L = r T K r + k r tr W1T W1 W1 + k r tr V1T V1 V1
T
2

)}

Se define

C3 = Z B +

C1
k

Procediendo como en Lewis (1996) uno obtiene que L es negativo tan amplio como cualquiera de

los dos

kC32
C0 +
4 b ........................................... (10.52)
r >
r
K min
o

>

C3
C0 C32
+
+
bz ................................. (10.53)
k
2
4

Por consiguiente L es negativa externa a un conjunto compacto y

r y Z

son UUB tan amplio

como el resto del control vlido dentro de este conjunto. Sin embargo el lmite de la ganancia PD
(10.46) implica que el conjunto compacto definido por

r br esta contenido en Sr asi que la

propiedad de aproximacin se mantiene en todo. Q.E.D.

En la prctica, no es necesario conocer las constantes c0 , c2 , C0 y C3 para seleccionar la


ganancia K v del PD de acuerdo a (10.46). Se puede seleccionar slo una ganancia bastante
grande como se muestra en las simulaciones.

138

10.e. Simulaciones
Simulacin 10.1
Brazo con dos eslabones, Con friccin, Trayectoria de referencia:

1 = Sin[t ], 2 = Cos[t ]

Programa de Mathematica PD+RNA_Model-Cancel


Diagonal K = 30, Diagonal = 5 Neuronas Normales: 10, Diagonal T = 30, Diagonal S =30
Neuronas Adicionales: 8, Diagonales
Angulos

, , , , ,

= 35

Rojo 1 y Azul 2
Error Rojo 1 y Error Azul 2

0.2

0.5

0.1

10

12

14

10

12

14

-0.5
-0.1

-1
-0.2

Error Rojo 1 y Error Azul 2

Velocidad
1

0.2

de 1 Rojo ; Velocidad

de 2 Azul

0.75
0.1

0.5
0.25
12.5

13

13.5

14

14.5

15

10

12

14

-0.25
-0.5

-0.1

-0.75
-1

-0.2

Observaciones:
Los diferentes efectos no-lineales causados por la friccin que se observan en las grficas de la
Simulacin 9.6 en el cual el sistema tiene un Controlador PD y una Red Neuronal aqu desaparecen.
La utilizacin de neuronas adicionales con funciones de activacin para saltos del Controlador PD y
Red Neuronal Aumentada Robusta adapta y modela las perturbaciones causadas por la friccin y
luego las cancela con el trmino de robustez que est integrado en la ecuacin diferencial que
actualiza los pesos. En las grficas que ilustran el error se puede observar el resultado de esta
cancelacin y como el error vuelve a tener una representacin muy parecida a la funcin de la
trayectoria de referencia, como si no tuviese el efecto causado por la friccin.
Para la programacin de esta simulacin se consideraron 4 neuronas adicionales ( 0 , 21 , 2 )
con signo positivo y 4 con signo negativo ( lo cual asegura la modelacin del error en depresiones y
en saltos. En este caso los valores iniciales de los pesos como en todos los casos son fijos; estos
normalmente son cero pero en esta simulacin son fijados en -0.1
139

Simulacin 10.2
Brazo con dos eslabones, Con friccin, Trayectoria de referencia:

1 = Sin[t ], 2 = Cos[t ]

Programa de Mathematica PD+RNA_Bifurcacin


Diagonal K = 379, Diagonal = 63 Neuronas normales: 10, Diagonal T = 30, Diagonal S =30,
Neuronas adicionales = 8, Diagonal G= 35, Diagonal = 35

Angulos

Rojo 1 y Azul 2

Angulo
s

Roj
o

1 y Azu 2
l

0.5
0.5

10

12

14

-0.5

-0.5

-1

-1

Error Rojo

1 y Error Azul 2

0.3
0.2
0.1
4

10

12

14

-0.1
-0.2
-0.3

140

1.5

Velocidad

de 1 Rojo ; Velocidad

de 2 Azul

10

0.5

7.5
5

-2

-1.5

-1

2.5

-0.5

0.5

1.5

-0.5

10

12

14
-1

-2.5
-5

-1.5

-7.5
-10

-2

-2

-1.5

-1

1.5

1.5

0.5

0.5

-0.5

0.5

1.5

-2

-1.5

-1

-0.5

0.5

-0.5

-0.5

-1

-1

-1.5

-1.5

-2

-2

1.5

Observaciones:
En esta simulacin se observa que el sistema comienza a ser inestable cuando se acerca a un valor
mximo de la ganancia K que es lmite. Aqu en los puntos donde los brazos se alinean comienza a ser
inestable por un efecto de bifurcacin.
Ahora para alcanzar mayor precisin en el seguimiento de la trayectoria de referencia
mantenindose el sistema estable es necesario aumentar slo la matriz diagonal de la ganancia

141

Simulacin 10.3
Brazo con dos eslabones, Con friccin, Trayectoria de referencia:

1 = Sin[t ], 2 = Cos[t ]

Programa de Mathematica PD+RNA_CFriccin_traySC_Aprox.Final


Diagonal K = 380; Diagonal = 10000 , Neuronas normales: 10, Diagonal T = 30,
Diagonal S =30,
Neuronas adicionales = 8, Diagonales

, , , , ,

= 35

Error Rojo 1 y Error Azul 2


0.0001
Error Rojo 1 y Error Azul 2
0.0001

0.00005

0.000075
0.00005
0.000025

10

12

14
12.5

13

13.5

14

14.5

15

-0.000025

-0.00005

-0.00005
-0.000075

-0.0001

-0.0001

Velocidad
1

de 1 Rojo ; Velocidad

de 2 Azul
2

0.75
0.0001

0.5
0.25

0.00005

-0.25

10

12

14
-0.0001

-0.00005

0.00005

1
0.0001

-0.5
-0.00005

-0.75
-1

-0.0001

ERROR

Grfica Paramtrica

Observaciones:
En esta simulacin la tolerancia del error es de una diezmilsima de radin. En la grfica del error no
aparecen alteraciones porque este Controlador cumple bien su funcin de modelar bien las
perturbaciones y las cancela usando el trmino de robustez. Esta grfica del error al igual que la de
velocidades muestran que se puede reducir an mas el tamao del error con un valor mayor en la
matriz diagonal de ganancia conservando estable el sistema.

Los valores de los pesos fueron

inicializados en -0.1.
142

11. OBSERVACIONES Y CONCLUSIONES


11.a. Observaciones
Los pesos de las redes neuronales son inicializados todos en cero o algn valor conveniente de tal
manera que cada vez que se corra el programa los pesos finales siempre sern los mismos. Los pesos
de V2 para la Red Neuronal Aumentada no son ajustados ya que son fijos y seleccionados en base a
la localizacin de la discontinuidad, la cual ocurre en el origen para la friccin.
Los algoritmos de ajuste de pesos de la red neuronal son una forma aumentada de la
retropropagacin. Los primeros trminos de (10.49), (10.50) y (10.51) son versiones modificadas del
algoritmo estandar de retropropagacin donde el error de seguimiento es la seal retropropagada.
El ltimo trmino corresponde a la modificacin-e es el trmino robusto, el cual garantiza la
estimacin de pesos limitada.
Por otro lado (10.43) muestra que los errores de los pesos en la red estn principalmente
limitados por Z B . En situaciones prcticas, no se tiene preocupacin de hacia donde convergen los
pesos de la red para aproximarse a la funcin desconocida del robot

f ( x) . El teorema muestra que

en un sentido prctico el error de seguimiento r ( t ) es sin embargo limitado a un pequeo valor. El


parmetro de ajuste k permite un diseo intercambiante entre las magnitudes relativas de r y de

.
Es evidente que hay un diseo libre en el grado de complejidad ( es decir

L ). A mayor

complejidad de la red (es decir mas unidades en la capa oculta), la estimacin del error de la red
decrece, mientras la constante C0 de lmite decrecer, resultando errores pequeos de seguimiento.
Por otro lado, una simplificada red con pocas unidades ocultas produce un lmite grande del error,
esta degradacin puede ser compensada con un valor alto en la ganancias K y del PD .
El Controlador PD y RNA con compensacin de friccin que se presenta aqu no requiere

LIP

(linealidad en parmetros). Aproximaciones estandar para la compensacin de friccin requieren


comnmente alguna previa linealizacin del modelo de friccin para alcanzar LIP . El requerimiento

LIP es una severa restriccin para los sistemas prcticos.


Aqu la propiedad de aproximacin de las redes es usada para evitar el LIP . El modelo de
friccin no lineal es lineal con respecto a las funciones de activacin de la red no lineales, lo cual es
una diferencia fundamental para la condicin LIP .

143

11.b. Conclusiones
El Controlador PD funciona bien en los casos en que se busca alcanzar una posicin determinada y
permanecer ah por algn tiempo, sin embargo cuando se desea alcanzar una tolerancia del error
muy baja, se requiere el utilizar valores de ganancias muy elevados.
El Controlador PD esta restringido, para seguir una trayectoria sinuosoidal, a que las funciones
que modele sean continuas y con no-linealidades suaves como se vio en las simulaciones 8.3 y 8.4. Al
incorporarse al sistema las perturbaciones, en este caso la provocada por la friccin, la cual es nolineal y pronunciada, el controlador no tiene la capacidad de modelar esta perturbacin y tiende a
rechazarla; sin embargo, no dejan de estar presentes alteraciones en ciertos puntos crticos donde se
acenta el efecto de la friccin. Lo anterior trae consigo la presencia constante de un riesgo de
inestabilidad y movimientos locales errticos del brazo.
El Controlador PD con Red Neuronal Normal por medio de su capacidad adaptacin modela
bien la trayectoria sinuosoidal y conforme se aumenta paulatinamente el nivel de aproximacin a la
trayectoria de referencia el sistema adapta y corrige el efecto de la perturbacin. Sin embargo como
se present en el inciso 9 con el sistema de actualizacin de pesos con retropopagacin nicamente,
no puede garantizar en todos los casos con perturbaciones que los pesos de la red se mantengan
acotados. El controlador PD con Red Neuronal Aumentada modela convenientemente la
perturbacin y al tener incluido un trmino de robustez en el controlador, este cancela el efecto
indeseable de la perturbacin y mantiene los pesos acotados garantizando un seguimiento de la
trayectoria siempre estable. Los conceptos de adaptabilidad y robustez son efectos contrarios y al
mismo tiempo complementarios, es decir un nivel de robustez alto reduce la capacidad de
adaptabilidad de la red, por lo tanto, hay que lograr un equilibrio conveniente de las dos
propiedades en la red. Se incorpora el concepto de pasividad para asegurar un conveniente manejo
de las energas dentro del sistema y su estabilidad.
En la bsqueda de los valores de las matrices diagonales ganancias

K y que permitan

aproximar el sistema controlado con redes neuronales a la trayectoria de referencia se encuentra el


lmite del valor de la matriz de valores de

K a travs de la ejercitacin sobre el programa. El

procedimiento es entonces primero partir de los valores de


de Coriolis y los valores de

K dados por los coeficientes del trmino

conforme la regla emprica del 5 al 20% e ir aumentando poco a poco

estos valores hasta que se llegue al valor de

K en el cual se presenta el efecto de bifurcacin donde

el sistema empieza a ser inestable, esto es cerca a su valor lmite, ahora slo es necesario aumentar el
valor de

y el sistema seguir la trayectoria de referencia tanto como se incremente este ltimo

valor, mantenindose estable. El diseo del Controlador PD mas la Red Neuronal Aumentada,
representa la aplicacin de una tcnica de modelado y control que combina convenientemente
una base terica suficientemente fundamentada que permite que se afinen y se garanticen
soluciones estables para a los requerimientos de problemas de control bajo la accin de efectos
reales de perturbaciones, con una forma no complicada y prctica de realizarse.
144

REFERENCIAS
R.1

Barrn A.R. Universal approximation bounds for superposition function , IEEE Trans. Inf. Theory ,
39 pp. 930-945 (1993).

R.2 Blanchard, P. Devaney, R.L. y Hall, G. R. . Ecuaciones Diferenciales. Thompson (1999).


R.3

Bose N.K. and Liang P. Neural Network Fundamentals , McGraw-Hill , New York, 1996.

R.4

Canudas de Wit H. Olsson , Astrom K.J. A new model for control of systems with friction , IEEE
Trans. Automatic Control , 40 419-425 , 1995.

R.5

Cervantes, I y Alvarez-Ramrez, J.. On the PID tracking control of robot manipulators. Systems
and Control Letters, 42, N. 1, pp. 37-46(10) (2001).

R.6

Craig, J.J.. Robtica (3a. ed.). Pearson Prentice Hall (2006).

R.7

Desoer, C.A. , Liu,R. and Auth, Jr.,L.V. Linearity vs nonlinearity and asymptotic stability in the
large , IRE Transactions on Circuit Theory 12:117-118 March 1965.

R.8

Domnguez, S., Campoy, P. Sebastin, J.M y Jimnez, A. Control en el Espacio de Estado.


Pearson Educacin, Espaa (2006).

R.9

Duarte, M.A. , and Narendra ,K.S. Combined direct and indirect approach to adaptive
control , Technical Report No. 8711 Center for Systems Science, Yale University, 1987.

R.10 Hahn, W. Stability of motion New York-Springer-Verlag, 1957.


R.11 Haykin S. Neural networks , IEEE Press and Macmillan , New York , 1994.
R.12 Jagannathan S. Robust backstepping control of robotic systems using neural networks in
Proceedings of the 37th IEEE Conference on Decision and Control , IEEE Computer Society
Press, Los Alamitos CA 943-948 , 1998.
R.13 Kalman and Bertram , Control systems analysis and desing via second method of Lyapunov
Journal of Basic Engineering 82: 371-392 June 1960.
R.14 Karakasoglu A. , Sudharsanan S.I. Identification and decentralized adaptive control using
dynamical neural networks with application to robots manipulators, IEEE Trans. Neural
Networks 4: 919-930 , 1993.
R.15 Kim Y.H. and Lewis F.L. High-Level Feedback Control with Neural Networks , World Scientific ,
River Edge. NJ., 1998.
R.16 Kosmatopoulos M. Polycarpou M. High-order neural network structures for identification of
dynamical systems IEEE Trans Neural Networks , 6 : 422-431 , 1995.
R.17 Kuo, B.C y Golnaraghi, F. Automatic Control Systems. Wiley (2002).
R.18 Lewis, Campos y Selmic. Neuro-Fuzzy Control of Industrial Systems with Actuator
Nonlinearities. Frontiers in Applied Mathematics SIAM (2002).
R.19 Lewis F.L. , Jagannathan S. and Yesildirek A. Neural Networks Control of Robot Manipulators
and Nonlinear Systems , Taylor and Francis , London 1999.

145

R.20 Lewis, F.L., Yesildirek, A. y Liu, K. Multilayer Neural-Net Controller with Guaranteed Tracking
Performance. IEEE Trans. on Neural Networks, vo. 7, No. 2, pp. 388-399 (1996).
R.21 Miller W.T. Sutton R.S. and Werbos P.J. Neural Networks for Control , MIT Press , Cambridge MA.
1991.
R.22 Moreno, L., Garrido-Valero, M.S. y Balaguer, C. Ingeniera de control: Modelado y Control
de Sistemas Dinmicos. Ariel, Espaa (2003).
R.23 Narendra K.S. and Annaswamy A.M. . A new adaptive law for robust adaptation without
persistent excitation IEEE Trans. Automatic Control 32:134-145 , 1987.
R.24 Narendra, K.S. y Annaswamy, A.M. Stable Adaptive Systems. Dover (2005).
R.25 Narendra, K.S. and Valavani L.S. Stable adaptive observers and controllers. Proceedings of
the IEE 64: 1198-1208 August 1976.
R.26 Ogata, K. Ingeniera de Control Moderna (4. ed.). Pearson Universitario (2003).
R.27 Osburn , P.V. , Whitaker, H.P. and Kezer A. , New developments in the design of model
reference adaptive control systems. In Proceedings of the IAS 29th Annual Meeting , New
York, NY ,1961.
R.28 Polycarpou M. M. Stable adaptive neural control scheme for nonlinear systems . IEEE Trans
Automatic Control. 41: 447-451 , 1996.
R.29 Selmic R.R. Neurocontrol of Industrial Motion Systems with Actuator Nonlinearities , Ph.D thesis .
University of Texas at Arlington , TX, 2000.
R.30 Spong, M.W. y Vidyasagar, M. Robot Dynamics and Control. Wiley (1989).
R.31 Yang B. and Asada H. A new approach of adaptive reinforcement learning control, in
Proceedings of the International Joint Conference on Neural Networks vol.1 627-630 , 1993.

146

A N E X O
ESCRITURA DE PROGRAMAS EN MATHEMATICA

Simulacin 8.2

PD_2e_Sfriccin_posicin2

Controlador PD;2 eslabones


Sin friccin;posicin deseada 2
qd = 81, 1<;

q = 81@tD, 2@tD<;
e = qd q;

de = D@e, tD;

= 880.35, 0<, 80, 0.35<<;

r = e + .de;

K = 88900, 0<, 80, 200<<;

= K.r;

robot1 =
88.09325 Cos@1@tDD + 0.0675 Sin@1@tD 2@tDD 2 @tD2 + 0.35 1 @tD +
0.0675 Cos@1@tD 2@tDD 2 @tD @@1DD<
robot2 =
81.32435 Cos@2@tDD 0.0675 Sin@1@tD 2@tDD 1 @tD2 +
0.0675 Cos@1@tD 2@tDD 1 @tD + 0.027 2 @tD @@2DD<

147

Solucion
init1 = 81@0D
init2 = 82@0D

3 2, 1 '@0D
3 2, 2 '@0D

0<;

0<;

robots = Join@robot1, robot2, init1, init2D


Tmax = 8;

sol = Flatten@NDSolve@robots, 81@tD, 2@tD<, 8t, 0, Tmax<DD


dte = D@e . sol, tD

d = D@81@tD, 2@tD< . sol, tD;

Plot@Evaluate@81@tD, 2@tD< . solD, 8t, 0, Tmax<, PlotRange All,


PlotStyle 8RGBColor@1, 0, 0D, RGBColor@0, 0, 1D<, PlotPoints 350,
AxesLabel 8t, <, PlotLabel "Angulos 1HrojoL y 2HazulL"D
Plot@Evaluate@e . solD, 8t, 0, Tmax<, PlotRange All,
PlotStyle 8RGBColor@1, 0, 0D, RGBColor@0, 0, 1D<, PlotPoints 350,
AxesLabel 8t, e<, PlotLabel "Errores e1HrojoL y e2HazulL" D
Show@%, PlotRange .01 8 1, 1<D

Plot@Evaluate@d . solD, 8t, 0, Tmax<, PlotRange All,


PlotStyle 8RGBColor@1, 0, 0D, RGBColor@0, 0, 1D<, PlotPoints 350,
AxesLabel 8t, '<, PlotLabel "Velocidades 1'HrojoL y 2'HazulL"D
Show@%, PlotRange 881, 3<, 8 1, 0<<D

armDibuja@dt_ D :=
Block@8trace1<,
trace1 = ParametricPlot@8Cos@1@tDD, Sin@1@tDD< . sol, 8t, 0, dt<,
PlotRange 88 2, 2<, 8 2, 2<<, PlotPoints 125, AspectRatio 1,
DisplayFunction IdentityD;
Block@8trace2<,
trace2 = ParametricPlot@8Cos@1@tDD + Cos@2@tDD, Sin@1@tDD + Sin@2@tDD< .
sol, 8t, 0, dt<, PlotRange 88 2, 2<, 8 2, 2<<, PlotPoints 125,
AspectRatio 1, DisplayFunction IdentityD;
Show@trace1, trace2,
Graphics@
88Thickness@.02D, Line@880, 0<, 8Cos@1@tDD, Sin@1@tDD<<D<,
8Thickness@.02D, Line@88Cos@1@tDD, Sin@1@tDD<,
8Cos@1@tDD + Cos@2@tDD, Sin@1@tDD + Sin@2@tDD<<D<,
8RGBColor@1, 0, 0D, PointSize@.02D, Point@80, 0<D<,
8RGBColor@1, 0, 0D, PointSize@.02D, Point@8Cos@1@tDD, Sin@1@tDD<D<,
8RGBColor@1, 0, 0D, PointSize@.02D,
Point@8Cos@1@tDD + Cos@2@tDD, Sin@1@tDD + Sin@2@tDD<D<< . sol .
t dtD, PlotRange 88 2, 2<, 8 2, 2<<
, AspectRatio 1, DisplayFunction $DisplayFunctionDDD
For@dt = .1, dt Tmax, dt += .2, armDibuja@dtDD

148

Simulacin 8.7

PD_Cfriccin_tray.Seno-Coseno_Aprox.Final

Control PD 2 eslabones
Con Friccin ; Trayectoria de referencia II Seno-Coseno
Tolerancia del error a una diezmilesima de radian
qd = 8Sin@tD, Cos@tD<;
q = 81@tD, 2@tD<;

e = qd q;

de = D@e, tD;

= 880.0003, 0<, 80, 0.0003<<;

r = e + .de;

K = 88450000, 0<, 80, 450000<<;


= K.r;

robot1 =
88.09325 Cos@1@tDD + 0.0675 Sin@1@tD 2@tDD 2 @tD2 + 0.35 1 @tD +
0.0675 Cos@1@tD 2@tDD 2 @tD +
H35 + 1.1 Exp@ 50 Abs@1 @tDDD + 0.9 H1 Exp@ 65 Abs@1 @tDDDLL
Sign@1 @tDD @@1DD<;
robot2 =
81.32435 Cos@2@tDD 0.0675 Sin@1@tD 2@tDD 1 @tD2 +
0.0675 Cos@1@tD 2@tDD 1 @tD + 0.027 2 @tD +
H38 + 1 Exp@ 55 Abs@2 @tDDD + 0.95 H1 Exp@ 60 Abs@2 @tDDDLL
Sign@2 @tDD @@2DD<;

149

Solucion
init1 = 81@0D

init2 = 82@0D

0, 1 '@0D
1, 2 '@0D

0<;

0<;

robots = Join@robot1, robot2, init1, init2D;

Tmax = 15;

sol = Flatten@NDSolve@robots, 81@tD, 2@tD<, 8t, 0, Tmax<,


StartingStepSize 1 10000,
Method 8"FixedStep", Method "ExplicitEuler"<, MaxSteps 1000000DD;
dte = D@e . sol, tD;

d = D@81@tD, 2@tD< . sol, tD;

G1 = Plot@Evaluate@81@tD, 2@tD< . solD, 8t, 0, Tmax<,


PlotStyle 8RGBColor@1, 0, 0D, RGBColor@0, 0, 1D<,
GridLines 8None, 8 1, 1<<, PlotLabel "Angulos 1HrojoL y 2HazulL"D;
G2 = Plot@8Sin@tD, Cos@tD<, 8t, 0, 15<D
Show@G1, G2, PlotRange 8 1, 1<D

Show@%, PlotRange 8811, 15<, 8 1, 1<<D

Plot@Evaluate@e . solD, 8t, 0, Tmax<, PlotRange 880, 15<, 8 1 104, 1 104<<,


GridLines 8None, 8 0.0001, 0.0001<<,
PlotStyle 8RGBColor@1, 0, 0D, RGBColor@0, 0, 1D<, PlotPoints 350,
PlotLabel "error 1HrojoL y error 2HazulL"D
Show@%, PlotRange 888, 15<, 8 1 104 , 1 104<<,
GridLines 8None, 8 0.0001, 0.0001<<D

Show@%, PlotRange 8812, 15<, 8 0.0002, 0.0002<<D

Plot@Evaluate@d . solD, 8t, 0, Tmax<, PlotRange All,


GridLines 8None, 8 1, 1<<,
PlotStyle 8RGBColor@1, 0, 0D, RGBColor@0, 0, 1D<, PlotPoints 350,
PlotLabel "Velocidades 1HrojoL y 2HazulL"D
Show@%, PlotRange 889, 15<, 8 1, 1<<D

150

Simulacin 9.2

PD+RN_Cfriccin_posicin_2
CONTROLADOR PD + RED NEURONAL
Con friccin ; posicin deseada 2
Dimensin de entrada ; neuronas de la capa oculta y neuronas de capa de salida
d = 2;
nInput = 5 dHq,dq,qd,dqd,d2qdL;
nHidden = 6;
nOut = d;

Funcin de Activacin

x1 = 81, 2, d1, d2, d1, d2, dd1, dd2, d2d1, d2d2<;


Extend@x_ListD := Prepend@x, 1D;

@z_ D = 1 H1 + Exp@ zDL;


SetAttributes@, ListableD

NN@x_List, VT_List, WT_ListD := WT.Extend@@VT.Extend@xDDD


NN@x1, V1T, W1TD;

H ordena una matriz m n por columnas L


J@8i_, j_ <, m_, n_ D := Hj 1L m + i

Estructura de la Red Neuronal

x1 = 81, 2, d1, d2, d1, d2, dd1, dd2, d2d1, d2d2<;


Length@x1D;

V1T = Table@v@J@8i, j<, nHidden, nInput + 1DD, 8i, 1, nHidden<, 8j, 1, nInput + 1<D;

W1T = Table@w@J@8i, j<, nOut, nHidden + 1DD, 8i, 1, nOut<, 8j, 1, nHidden + 1<D;

Valores de las matrices de ganancia y tasa de aprendizaje


T=
S=
=
K=
k=

DiagonalMatrix@Table@10, 8nInput + 1<DD;


DiagonalMatrix@Table@10, 8nHidden + 1<DD;
DiagonalMatrix@Table@0.6, 8nOut<DD;
DiagonalMatrix@Table@18, 8nOut<DD;
0.01;

Error de seguimiento , su derivada y el error filtrado de seguimiento

e@x_ListD := 8Part@x, 5D Part@x, 1D, Part@x, 6D Part@x, 2D<


de@x_ListD := 8Part@x, 7D Part@x, 3D, Part@x, 8D Part@x, 4D<
rT@x_ListD := de@xD + .e@xD;
151

Derivada de la funcin de activacin y matriz derivada


d@z_ D =

Exp@ zD

H1 + Exp@ zDL2

H Matriz derivada de @z1,z2,...,zLD=81,@z1D,@z2D,...,@zLD<L


D@z_ListD := Block@8 M = Table@0, 8nHidden<, 8nHidden<D<,
For@i = 1, i nHidden, i ++, M@@i, iDD = d@z@@iDDDD;
M = Prepend@ M, Table@0, 8nHidden<DD;
Return@ MD;D
norm@z_ListD := Sqrt@Inner@Times, z, zDD
H Campos vectoriales que definen el lado derecho del tunning L

Reglas de Ajuste de Pesos de la Red Neuronal

dW1@x_List, VT_List, WT_ListD := Outer@Times, S.Extend@@VT.Extend@xDDD, rT@xDD;


dV1@x_List, VT_List, WT_ListD :=
T.Outer@Times, Extend@xD, rT@xDD.WT.D@VT.Extend@xDD;

dW1@x1, V1T, W1TD Dimensions;


dV1@x1, V1T, W1TD Dimensions;

Reglas para sustituir variables por variables dependientes de "t" y para sustituir
variables por derivadas dependientes de "t"

rule1 = 8<; oderule1 = 8<;


For@i = 1, i Length@x1D, i ++,
rule1 = Append@rule1, ToExpression@ToString@x1@@iDDD <> "@tD"DD;
oderule1 = Append@oderule1, ToExpression@ToString@x1@@iDDD <> "'" <> "@tD"DD;D

H Trayectoria deseada; en general se usa una funcin de t L

Trayectoria de referencia

track = 8d1 1, d2 1, dd1 0, dd2 0, d2d1 0, d2d2 0<;


along1 = Thread@x1 rule1D;

H Regla de sustitucin L

odealong1 = Thread@x1 oderule1D;

152

Reglas para generar la ecuacin vectorial equivalente a la ecuacin matricial V1'=dV1


V1TFlat = Flatten@V1TD;
Length@V1TFlatD;

rule2 = 8<; oderule2 = 8<


For@i = 1, i Length@V1TFlatD, i ++,
rule2 = Append@rule2, ToExpression@ToString@V1TFlat@@iDDD <> "@tD"DD;
oderule2 =
Append@oderule2, ToExpression@ToString@V1TFlat@@iDDD <> "'" <> "@tD"DD;D;
along2 = Thread@V1TFlat rule2D;

odealong2 = Thread@V1TFlat oderule2D;

W1TFlat = Flatten@W1TD;
Length@W1TFlatD;

rule3 = 8<; oderule3 = 8<;


For@i = 1, i Length@W1TFlatD, i ++,
rule3 = Append@rule3, ToExpression@ToString@W1TFlat@@iDDD <> "@tD"DD;
oderule3 = Append@oderule3,
ToExpression@ToString@W1TFlat@@iDDD <> "'" <> "@tD"DD;D;
along3 = Thread@W1TFlat rule3D;

odealong3 = Thread@W1TFlat oderule3D;

along = Join@along1, along2, along3D;

odealong = Join@odealong1, odealong2, odealong3D;

Generar las ecuaciones vectoriales equivalentes a las ecuaciones matriciales


W1'=dW1 y V1'=dV1
ode2 = Thread@HFlatten@Transpose@W1TDD . odealongL ==
HFlatten@dW1@x1, V1T, W1TD . trackD . alongLD;
ode3 = Thread@HFlatten@Transpose@V1TDD . odealongL
HFlatten@dV1@x1, V1T, W1TD . trackD . alongLD;

force =
8H0.027 1 0.21851774999999998 Cos@1D 0.0675 2 Cos@1 1. 2D +
0.08939362499999999 Cos@1 1. 2D Cos@2D
0.00455625 Cos@1 1. 2D Sin@1 1. 2D d12
0.0018225000000000001 Sin@1 1. 2D d22 L
H0.00945 0.00455625 Cos@1 1. 2D2 L +
H35 + 1.1 Exp@ 50 Abs@d1DD + 0.9 H1 Exp@ 65 Abs@d1DDLL Sign@d1D,
H1. H 0.35 2 + 0.46352249999999995 Cos@2D 0.023625 Sin@1 1. 2D d12
0.0675 Cos@1 1. 2D
H 1. 1 + 8.09325 Cos@1D + 0.0675 Sin@1 1. 2D d22 LLL
H0.00945 0.00455625 Cos@1 1. 2D2 L +
H38 + 1 Exp@ 55 Abs@d2DD + 0.95 H1 Exp@ 60 Abs@d2DDLL Sign@d2D<;

Control PD

0 = K.rT@x1D;

153

Control Neuronal

= NN@x1, V1T, W1TD + 0 . track;


H =0.track; L

Retroalimentacin
1 = @@1DD;
2 = @@2DD;

ForceAlong = force . along;

ode1 = 81 '@tD == d1@tD, 2 '@tD == d2@tD, d1 '@tD == ForceAlong@@1DD,


d2 '@tD ForceAlong@@2DD<;

ode = Join@ode1, ode2, ode3D;


odeA = Join@ode2, ode3D;

L = Length@odeAD;

vars = Join@81@tD, 2@tD, d1@tD, d2@tD<,


Table@v@iD@tD, 8i, 1, Length@Flatten@V1TDD<D,
Table@w@iD@tD, 8i, 1, Length@Flatten@W1TDD<DD;

varsini = Join@81@0D, 2@0D, d1@0D, d2@0D<,


Table@v@iD@0D, 8i, 1, Length@Flatten@V1TDD<D,
Table@w@iD@0D, 8i, 1, Length@Flatten@W1TDD<DD;
odeini =
Thread@varsini

Join@83 2, 3 2, 0, 0<, Table@Random@Real, 80, 0<D, 8L<DDD;

Tmax = 15;

sol = NDSolve@Join@ode, odeiniD, vars, 8t, 0, Tmax<, StartingStepSize 1 10000,


Method 8"FixedStep", Method "ExplicitRungeKutta"<, MaxSteps 1000000D;

Plot@Evaluate@81@tD, 2@tD< . solD, 8t, 0, Tmax<,


PlotStyle 8RGBColor@1, 0, 0D, RGBColor@0, 0, 1D<, GridLines 8None, 80, 1<<,
PlotRange 880, 15<, 80, 5<<, PlotLabel "Angulos Rojo 1 y Azul 2"D;
Plot@Evaluate@81@tD 1, 2@tD 1< . solD, 8t, 0, Tmax<,
PlotStyle 8RGBColor@1, 0, 0D, RGBColor@0, 0, 1D<,
PlotRange 880, 15<, 8 1, 5<<,
PlotLabel "Error Rojo 1 y Error Azul 2"D;

Show@%, PlotRange 8811, 15<, 8 1 103, 1 103 <<D

Plot@Evaluate@8d1@tD, d2@tD< . solD, 8t, 0, Tmax<,


PlotStyle 8RGBColor@1, 0, 0D, RGBColor@0, 0, 1D<,
GridLines 8None, 80, 2<<, PlotRange 880, 15<, 8 5, 1<<,
PlotLabel "Velocidad de 1 Rojo; Velocidad de 2 Azul "D;

Show@%, PlotRange 880, 15<, 8 1, 1<<D

154

Simulacin 9.5

PD+RN_Cfriccin_SC_Aprox._1
CONTROLADOR PD + RED NEURONAL
Con friccin ; seguimiento de trayectoria Seno-Coseno
para Comparativo con RNA
Dimensin de entrada ; neuronas de la capa oculta y neuronas de capa de salida
d = 2;
nInput = 5 dHq,dq,qd,dqd,d2qdL;
nHidden = 10;
nOut = d;

Funcin de Activacin

x1 = 81, 2, d1, d2, d1, d2, dd1, dd2, d2d1, d2d2<;


Extend@x_ListD := Prepend@x, 1D;

@z_ D = 1 H1 + Exp@ zDL;


SetAttributes@, ListableD

NN@x_List, VT_List, WT_ListD := WT.Extend@@VT.Extend@xDDD


NN@x1, V1T, W1TD;

H ordena una matriz m n por columnas L


J@8i_, j_<, m_, n_ D := Hj 1L m + i

Estructura de la Red Neuronal

x1 = 81, 2, d1, d2, d1, d2, dd1, dd2, d2d1, d2d2<;


Length@x1D;

V1T = Table@v@J@8i, j<, nHidden, nInput + 1DD, 8i, 1, nHidden<, 8j, 1, nInput + 1<D;
W1T = Table@w@J@8i, j<, nOut, nHidden + 1DD, 8i, 1, nOut<, 8j, 1, nHidden + 1<D;

Valores de las matrices de ganancia y tasa de aprendizaje


T=
S=
=
K=
k=

DiagonalMatrix@Table@30, 8nInput + 1<DD;


DiagonalMatrix@Table@30, 8nHidden + 1<DD;
DiagonalMatrix@Table@5, 8nOut<DD;
DiagonalMatrix@Table@30, 8nOut<DD;
0.05;

Error de seguimiento , su derivada y el error filtrado de seguimiento

e@x_ListD := 8Part@x, 5D Part@x, 1D, Part@x, 6D Part@x, 2D<


de@x_ListD := 8Part@x, 7D Part@x, 3D, Part@x, 8D Part@x, 4D<
rT@x_ListD := de@xD + .e@xD;
155

Derivada de la funcin de activacin y matriz derivada


d@z_ D =

Exp@ zD

H1 + Exp@ zDL2

H Matriz derivada de @z1,z2,...,zLD=81,@z1D,@z2D,...,@zLD<L


D@z_ListD := Block@8 M = Table@0, 8nHidden<, 8nHidden<D<,
For@i = 1, i nHidden, i ++, M@@i, iDD = d@z@@iDDDD;
M = Prepend@ M, Table@0, 8nHidden<DD;
Return@ MD;D

norm@z_ListD := Sqrt@Inner@Times, z, zDD


H Campos vectoriales que definen el lado derecho del tunning L

Reglas de Ajuste de Pesos de la Red Neuronal

dW1@x_List, VT_List, WT_ListD :=


Outer@Times, S.Extend@@VT.Extend@xDDD, rT@xDD
HOuter@Times, S.D@VT.Extend@xDD.VT.Extend@xD, rT@xDDL
Hk norm@rT@xDD S.Transpose@WTDL;
dV1@x_List, VT_List, WT_ListD :=
T.Outer@Times, Extend@xD, rT@xDD.WT.D@VT.Extend@xDD
Hk norm@rT@xDD T.Transpose@VTDL;
dW1@x1, V1T, W1TD Dimensions;
dV1@x1, V1T, W1TD Dimensions;

Reglas para sustituir variables por variables dependientes de "t" y para sustituir
variables por derivadas dependientes de "t"

rule1 = 8<; oderule1 = 8<;


For@i = 1, i Length@x1D, i ++,
rule1 = Append@rule1, ToExpression@ToString@x1@@iDDD <> "@tD"DD;
oderule1 = Append@oderule1, ToExpression@ToString@x1@@iDDD <> "'" <> "@tD"DD;D

H Trayectoria deseada; en general se usa una funcin de t L

Trayectoria de referencia

track = 8d1 Sin@tD, d2 Cos@tD, dd1 0, dd2 0, d2d1 0, d2d2 0<;


along1 = Thread@x1 rule1D;

H Regla de sustitucin L

odealong1 = Thread@x1 oderule1D;

156

Reglas para generar la ecuacin vectorial equivalente a la ecuacin matricial V1'=dV1


V1TFlat = Flatten@V1TD;
Length@V1TFlatD;

rule2 = 8<; oderule2 = 8<


For@i = 1, i Length@V1TFlatD, i ++,
rule2 = Append@rule2, ToExpression@ToString@V1TFlat@@iDDD <> "@tD"DD;
oderule2 =
Append@oderule2, ToExpression@ToString@V1TFlat@@iDDD <> "'" <> "@tD"DD;D;
8<

along2 = Thread@V1TFlat rule2D;

odealong2 = Thread@V1TFlat oderule2D;

W1TFlat = Flatten@W1TD;
Length@W1TFlatD;

rule3 = 8<; oderule3 = 8<;


For@i = 1, i Length@W1TFlatD, i ++,
rule3 = Append@rule3, ToExpression@ToString@W1TFlat@@iDDD <> "@tD"DD;
oderule3 = Append@oderule3,
ToExpression@ToString@W1TFlat@@iDDD <> "'" <> "@tD"DD;D;

along3 = Thread@W1TFlat rule3D;

odealong3 = Thread@W1TFlat oderule3D;

along = Join@along1, along2, along3D;

odealong = Join@odealong1, odealong2, odealong3D;

Generar las ecuaciones vectoriales equivalentes a las ecuaciones matriciales


W1'=dW1 y V1'=dV1
ode2 = Thread@HFlatten@Transpose@W1TDD . odealongL ==
HFlatten@dW1@x1, V1T, W1TD . trackD . alongLD;

ode3 = Thread@HFlatten@Transpose@V1TDD . odealongL


HFlatten@dV1@x1, V1T, W1TD . trackD . alongLD;

force =
8H0.027 1 0.21851774999999998 Cos@1D 0.0675 2 Cos@1 1. 2D +
0.08939362499999999 Cos@1 1. 2D Cos@2D
0.00455625 Cos@1 1. 2D Sin@1 1. 2D d12
0.0018225000000000001 Sin@1 1. 2D d22L
H0.00945 0.00455625 Cos@1 1. 2D2L +
H35 + 1.1 Exp@ 50 Abs@d1DD + 0.9 H1 Exp@ 65 Abs@d1DDLL Sign@d1D,
H1. H 0.35 2 + 0.46352249999999995 Cos@2D 0.023625 Sin@1 1. 2D d12
0.0675 Cos@1 1. 2D
H 1. 1 + 8.09325 Cos@1D + 0.0675 Sin@1 1. 2D d22LLL
H0.00945 0.00455625 Cos@1 1. 2D2L +
H38 + 1 Exp@ 55 Abs@d2DD + 0.95 H1 Exp@ 60 Abs@d2DDLL Sign@d2D<;

Control PD

0 = K.rT@x1D;

157

Control Neuronal

= NN@x1, V1T, W1TD + 0 . track;


H =0.track; L

Retroalimentacin
1 = @@1DD;
2 = @@2DD;

ForceAlong = force . along;

ode1 = 81'@tD == d1@tD, 2'@tD == d2@tD, d1'@tD == ForceAlong@@1DD,


d2'@tD ForceAlong@@2DD<;

ode = Join@ode1, ode2, ode3D;


odeA = Join@ode2, ode3D;
L = Length@odeAD;

vars = Join@81@tD, 2@tD, d1@tD, d2@tD<,


Table@v@iD@tD, 8i, 1, Length@Flatten@V1TDD<D,
Table@w@iD@tD, 8i, 1, Length@Flatten@W1TDD<DD;
varsini = Join@81@0D, 2@0D, d1@0D, d2@0D<,
Table@v@iD@0D, 8i, 1, Length@Flatten@V1TDD<D,
Table@w@iD@0D, 8i, 1, Length@Flatten@W1TDD<DD;
odeini =
Thread@varsini

Join@80, 1, 0, 0<, Table@Random@Real, 80.1, 0.1<D, 8L<DDD;

Tmax = 10;

sol = NDSolve@Join@ode, odeiniD, vars, 8t, 0, Tmax<, StartingStepSize 1 10000,


Method 8"FixedStep", Method "ExplicitRungeKutta"<, MaxSteps 1000000D;

G1 = Plot@Evaluate@81@tD, 2@tD< . solD, 8t, 0, Tmax<,


PlotStyle 8RGBColor@1, 0, 0D, RGBColor@0, 0, 1D<, GridLines 8None, 8 1, 1<<,
PlotRange 880, 10<, 8 1.2, 1.2<<, PlotLabel "Angulos Rojo 1 y Azul 2"D;

G2 = Plot@8Sin@tD, Cos@tD<, 8t, 0, 10<D

Show@G1, G2, PlotRange 880, 10<, 8 1.2, 1.2<<D

Show@G1, G2, PlotRange 884.5, 10<, 8 1.2, 1.2<<D

Plot@Evaluate@81@tD Sin@tD, 2@tD Cos@tD< . solD, 8t, 0, Tmax<,


PlotStyle 8RGBColor@1, 0, 0D, RGBColor@0, 0, 1D<,
PlotRange 880, 10<, 8 .2, .2<<, GridLines 8None, 8 .2, .2<<,
PlotLabel "Error Rojo 1 y Error Azul 2"D;
Show@%, PlotRange 882.5, 7.5<, 8 .2, .2<<D

Plot@Evaluate@8d1@tD, d2@tD< . solD, 8t, 0, Tmax<,


PlotStyle 8RGBColor@1, 0, 0D, RGBColor@0, 0, 1D<,
PlotRange 880, 10<, 8 1, 1<<,
PlotLabel "Velocidad de 1 Rojo; Velocidad de 2 Azul "D;
Show@%, PlotRange 880, 2<, 8 1.2, 1<<D

158

Simulacin 10.3.

PD+RNA_Cfriccin_traySC_Aprox.Final
CONTROLADOR PD + RED NEURONAL + RED AUMENTADA

Con friccin ; Trayectoria de referencia seno-coseno


8 neuronas adicionales 4 con funcin de activacin positiva y 4 con negativa
Dimensin de entrada ; neuronas de la capa oculta y neuronas de capa de salida
nInput = 10;
nHidden = 10;
nHiddenA1 = 1;
nHiddenA2 = 2;
nHiddenA3 = 1;
nHiddenB1 = 1;
nHiddenB2 = 2;
nHiddenB3 = 1;
nOut = 2;

Funcin de Activacin

x1 = 81, 2, d1, d2, d1, d2, dd1, dd2, d2d1, d2d2<;

Extend@x_ListD := Prepend@x, 1D;


@z_ D = 1 H1 + Exp@ zDL
SetAttributes@, ListableD;

1@z_ D = Piecewise@880, z < 0<, 8HH1


SetAttributes@1, ListableD;
2@z_ D = Piecewise@880, z < 0<, 8HH1
SetAttributes@2, ListableD;
3@z_ D = Piecewise@880, z < 0<, 8HH1
SetAttributes@3, ListableD;

1@z_ D = Piecewise@880, z < 0<, 8 HH1


SetAttributes@1, ListableD;
2@z_ D = Piecewise@880, z < 0<, 8 HH1
SetAttributes@2, ListableD;
3@z_ D = Piecewise@880, z < 0<, 8 HH1
SetAttributes@3, ListableD;

L H1 +

LL0, z 0<<D

L H1 +

L H1 +

LL1, z 0<<D
LL2, z 0<<D

L H1 +

L H1 +

L H1 +

LL0, z 0<<D
LL1, z 0<<D
LL2, z 0<<D

NN@x_List, VT_List, WT_List, AT_List, BT_List, CT_List, DT_List, ET_List,


FT_List, GT_List, HT_List, LT_List, MT_List, NT_List, OT_List,
PT_List, QT_List, RT_List, UT_List,D :=
WT.Extend@@VT.Extend@xDDD + BT.1@AT.Extend@xDD + DT.2@CT.Extend@xDD +
FT.3@ET.Extend@xDD + MT.1@LT.Extend@xDD + OT.2@NT.Extend@xDD +
QT.3@RT.Extend@xDD;

NN@x1, V1T, W1T, A1T, B1T, C1T, D1T, E1T, F1T, L1T, M1T, N1T, O1T, R1T, Q1TD;

H ordena una matriz m n por columnas L


J@8i_, j_ <, m_, n_ D := Hj 1L m + i;

159

Estructura de la Red Neuronal


Length@x1D;

V1T = Table@v@J@8i, j<, nHidden, nInput + 1DD, 8i, 1, nHidden<, 8j, 1, nInput + 1<D;

V1T Dimensions;

A1T = Table@J@81, 1<, nHiddenA1, nInput + 1D, 8i, 1, nHiddenA1<, 8j, 1, nInput + 1<D;

A1T Dimensions;

C1T = Table@J@81, 1<, nHiddenA2, nInput + 1D, 8i, 1, nHiddenA2<, 8j, 1, nInput + 1<D;

C1T Dimensions;

E1T = Table@J@81, 1<, nHiddenA3, nInput + 1D, 8i, 1, nHiddenA3<, 8j, 1, nInput + 1<D;

E1T Dimensions;

L1T = Table@J@81, 1<, nHiddenB1, nInput + 1D, 8i, 1, nHiddenB1<, 8j, 1, nInput + 1<D;

L1T Dimensions;

N1T = Table@J@81, 1<, nHiddenB2, nInput + 1D, 8i, 1, nHiddenB2<, 8j, 1, nInput + 1<D;

N1T Dimensions;

R1T = Table@J@81, 1<, nHiddenB3, nInput + 1D, 8i, 1, nHiddenB3<, 8j, 1, nInput + 1<D;

R1T Dimensions;

W1T = Table@w@J@8i, j<, nOut, nHidden + 1DD, 8i, 1, nOut<, 8j, 1, nHidden + 1<D;

W1T Dimensions;

B1T = Table@w1@J@8i, j<, nOut, nHiddenA1DD, 8i, 1, nOut<, 8j, 1, nHiddenA1<D;

B1T Dimensions;

D1T = Table@w2@J@8i, j<, nOut, nHiddenA2DD, 8i, 1, nOut<, 8j, 1, nHiddenA2<D;

D1T Dimensions;

F1T = Table@w3@J@8i, j<, nOut, nHiddenA3DD, 8i, 1, nOut<, 8j, 1, nHiddenA3<D;

F1T Dimensions;

M1T = Table@w5@J@8i, j<, nOut, nHiddenB1DD, 8i, 1, nOut<, 8j, 1, nHiddenB1<D;

M1T Dimensions;

O1T = Table@w6@J@8i, j<, nOut, nHiddenB2DD, 8i, 1, nOut<, 8j, 1, nHiddenB2<D;

O1T Dimensions;

Q1T = Table@w7@J@8i, j<, nOut, nHiddenB3DD, 8i, 1, nOut<, 8j, 1, nHiddenB3<D;

Q1T Dimensions;

160

Valores de las matrices de ganancia y tasa de aprendizaje


T=
S=
=
=
=
=
=
=
=
K=
k=

DiagonalMatrix@Table@30, 8nInput + 1<DD;


DiagonalMatrix@Table@30, 8nHidden + 1<DD;
DiagonalMatrix@Table@35, 8nHiddenA1<DD;
DiagonalMatrix@Table@35, 8nHiddenA2<DD;
DiagonalMatrix@Table@35, 8nHiddenA3<DD;
DiagonalMatrix@Table@35, 8nHiddenB1<DD;
DiagonalMatrix@Table@35, 8nHiddenB2<DD;
DiagonalMatrix@Table@35, 8nHiddenB3<DD;
DiagonalMatrix@Table@10000, 8nOut<DD;
DiagonalMatrix@Table@380, 8nOut<DD;
0.05;

Error de seguimiento , su derivada y el error filtrado de seguimiento

e@x_ListD := 8Part@x, 5D Part@x, 1D, Part@x, 6D Part@x, 2D<


de@x_ListD := 8Part@x, 7D Part@x, 3D, Part@x, 8D Part@x, 4D<
rT@x_ListD := de@xD + .e@xD;

Derivada de la funcin de activacin y matriz derivada


d@z_ D =

Exp@ zD

H1 + Exp@ zDL2

H Matriz derivada de @z1,z2,...,zLD=81,@z1D,@z2D,...,@zLD<L


D@z_ListD := Block@8 M = Table@0, 8nHidden<, 8nHidden<D<,
For@i = 1, i nHidden, i ++, M@@i, iDD = d@z@@iDDDD;
M = Prepend@ M, Table@0, 8nHidden<DD;
Return@ MD;D;

norm@z_ListD := Sqrt@Inner@Times, z, zDD;


H Campos vectoriales que definen el lado derecho del tunning L

Reglas de Ajuste de Pesos de la Red Neuronal

dW1@x_List, VT_List, WT_ListD :=


Outer@Times, S.Extend@@VT.Extend@xDDD, rT@xDD
HOuter@Times, S.D@VT.Extend@xDD.VT.Extend@xD, rT@xDDL
Hk norm@rT@xDD S.Transpose@WTDL
dW1@x1, V1T, W1TD Dimensions;

dV1@x_List, VT_List, WT_ListD :=


T.Outer@Times, Extend@xD, rT@xDD.WT.D@VT.Extend@xDD
Hk norm@rT@xDD T.Transpose@VTDL
dV1@x1, V1T, W1TD Dimensions;

dB1@x_List, AT_List, BT_ListD :=


Outer@Times, .1@AT.Extend@xDD, rT@xDD Hk norm@rT@xDD .Transpose@BTDL
dB1@x1, A1T, B1TD Dimensions;

dD1@x_List, CT_List, DT_ListD :=


Outer@Times, .2@CT.Extend@xDD, rT@xDD Hk norm@rT@xDD .Transpose@DTDL
dD1@x1, C1T, D1TD Dimensions;

dF1@x_List, ET_List, FT_ListD :=


Outer@Times, .3@ET.Extend@xDD, rT@xDD Hk norm@rT@xDD .Transpose@FTDL
dF1@x1, E1T, F1TD Dimensions;

dM1@x_List, LT_List, MT_ListD :=


Outer@Times, .1@LT.Extend@xDD, rT@xDD Hk norm@rT@xDD .Transpose@ MTDL
dM1@x1, L1T, M1TD Dimensions;

dO1@x_List, NT_List, OT_ListD :=


Outer@Times, .2@NT.Extend@xDD, rT@xDD Hk norm@rT@xDD .Transpose@OTDL
dO1@x1, N1T, O1TD Dimensions;

dQ1@x_List, RT_List, QT_ListD :=


Outer@Times, .3@RT.Extend@xDD, rT@xDD Hk norm@rT@xDD .Transpose@QTDL;

dQ1@x1, R1T, Q1TD Dimensions;

161

Reglas para sustituir variables por variables dependientes de "t" y para sustituir
variables por derivadas dependientes de "t"

rule1 = 8<; oderule1 = 8<;


For@i = 1, i Length@x1D, i ++,
rule1 = Append@rule1, ToExpression@ToString@x1@@iDDD <> "@tD"DD;
oderule1 = Append@oderule1, ToExpression@ToString@x1@@iDDD <> "'" <> "@tD"DD;D

H Trayectoria deseada; en general se usa una funcin de t L

Trayectoria de referencia

track = 8d1 Sin@tD, d2 Cos@tD, dd1 0, dd2 0, d2d1 0, d2d2 0<;

along1 = Thread@x1 rule1D;

H Regla de sustitucin L

odealong1 = Thread@x1 oderule1D;

Reglas para generar la ecuacin vectorial equivalente a la ecuacin matricial V1'=dV1


V1TFlat = Flatten@V1TD;

A1TFlat = Flatten@A1TD;
C1TFlat = Flatten@C1TD;
E1TFlat = Flatten@E1TD;
L1TFlat = Flatten@L1TD;
N1TFlat = Flatten@N1TD;
R1TFlat = Flatten@R1TD;
Length@V1TFlatD;
Length@A1TFlatD;
Length@C1TFlatD;
Length@E1TFlatD;
Length@L1TFlatD;
Length@N1TFlatD;
Length@R1TFlatD;

162

rule2 = 8<; oderule2 = 8<


For@i = 1, i Length@V1TFlatD, i ++,
rule2 = Append@rule2, ToExpression@ToString@V1TFlat@@iDDD <> "@tD"DD;
oderule2 =
Append@oderule2, ToExpression@ToString@V1TFlat@@iDDD <> "'" <> "@tD"DD;D;

along2 = Thread@V1TFlat rule2D;

odealong2 = Thread@V1TFlat oderule2D;

W1TFlat = Flatten@W1TD;
Length@W1TFlatD;

rule3 = 8<; oderule3 = 8<;


For@i = 1, i Length@W1TFlatD, i ++,
rule3 = Append@rule3, ToExpression@ToString@W1TFlat@@iDDD <> "@tD"DD;
oderule3 = Append@oderule3,
ToExpression@ToString@W1TFlat@@iDDD <> "'" <> "@tD"DD;D;

along3 = Thread@W1TFlat rule3D;

odealong3 = Thread@W1TFlat oderule3D;

B1TFlat = Flatten@B1TD;
Length@B1TFlatD;

rule3A = 8<; oderule3A = 8<


For@i = 1, i Length@B1TFlatD, i ++,
rule3A = Append@rule3A, ToExpression@ToString@B1TFlat@@iDDD <> "@tD"DD;
oderule3A =
Append@oderule3A, ToExpression@ToString@B1TFlat@@iDDD <> "'" <> "@tD"DD;D
along3A = Thread@B1TFlat rule3AD;

odealong3A = Thread@B1TFlat oderule3AD;

D1TFlat = Flatten@D1TD;

Length@D1TFlatD;

rule3B = 8<; oderule3B = 8<;


For@i = 1, i Length@D1TFlatD, i ++,
rule3B = Append@rule3B, ToExpression@ToString@D1TFlat@@iDDD <> "@tD"DD;
oderule3B = Append@oderule3B,
ToExpression@ToString@D1TFlat@@iDDD <> "'" <> "@tD"DD;D;

along3B = Thread@D1TFlat rule3BD;

odealong3B = Thread@D1TFlat oderule3BD;

F1TFlat = Flatten@F1TD;

Length@F1TFlatD;

163

rule3C = 8<; oderule3C = 8<;


For@i = 1, i Length@F1TFlatD, i ++,
rule3C = Append@rule3C, ToExpression@ToString@F1TFlat@@iDDD <> "@tD"DD;
oderule3C = Append@oderule3C,
ToExpression@ToString@F1TFlat@@iDDD <> "'" <> "@tD"DD;D;
along3C = Thread@F1TFlat rule3CD;

odealong3C = Thread@F1TFlat oderule3CD;


M1TFlat = Flatten@ M1TD;

Length@ M1TFlatD;

rule3E = 8<; oderule3E = 8<;


For@i = 1, i Length@ M1TFlatD, i ++,
rule3E = Append@rule3E, ToExpression@ToString@ M1TFlat@@iDDD <> "@tD"DD;
oderule3E = Append@oderule3E,
ToExpression@ToString@ M1TFlat@@iDDD <> "'" <> "@tD"DD;D;

along3E = Thread@ M1TFlat rule3ED;

odealong3E = Thread@ M1TFlat oderule3ED;


O1TFlat = Flatten@O1TD;

Length@O1TFlatD;

rule3F = 8<; oderule3F = 8<;


For@i = 1, i Length@O1TFlatD, i ++,
rule3F = Append@rule3F, ToExpression@ToString@O1TFlat@@iDDD <> "@tD"DD;
oderule3F = Append@oderule3F,
ToExpression@ToString@O1TFlat@@iDDD <> "'" <> "@tD"DD;D;
along3F = Thread@O1TFlat rule3FD;

odealong3F = Thread@O1TFlat oderule3FD;


Q1TFlat = Flatten@Q1TD;

Length@Q1TFlatD;

rule3G = 8<; oderule3G = 8<;


For@i = 1, i Length@Q1TFlatD, i ++,
rule3G = Append@rule3G, ToExpression@ToString@Q1TFlat@@iDDD <> "@tD"DD;
oderule3G = Append@oderule3G,
ToExpression@ToString@Q1TFlat@@iDDD <> "'" <> "@tD"DD;D;
along3G = Thread@Q1TFlat rule3GD;

odealong3G = Thread@Q1TFlat oderule3GD;

along = Join@along1, along2, along3, along3A, along3B, along3C, along3E,


along3F, along3GD;
Length@alongD;

odealong = Join@odealong1, odealong2, odealong3, odealong3A, odealong3B,


odealong3C, odealong3E, odealong3F, odealong3GD;

Length@odealongD;

164

Generar las ecuaciones vectoriales equivalentes a las ecuaciones matriciales


W1'=dW1 y V1'=dV1
ode2 = Thread@HFlatten@Transpose@W1TDD . odealongL ==
HFlatten@dW1@x1, V1T, W1TD . trackD . alongLD;

ode3 = Thread@HFlatten@Transpose@V1TDD . odealongL


HFlatten@dV1@x1, V1T, W1TD . trackD . alongLD;

ode3A = Thread@HFlatten@Transpose@B1TDD . odealongL


HFlatten@dB1@x1, A1T, B1TD . trackD . alongLD;
Length@ode3AD;

ode3B = Thread@HFlatten@Transpose@D1TDD . odealongL


HFlatten@dD1@x1, C1T, D1TD . trackD . alongLD;

Length@ode3BD;

ode3C = Thread@HFlatten@Transpose@F1TDD . odealongL


HFlatten@dF1@x1, E1T, F1TD . trackD . alongLD;

Length@ode3CD;

ode3E = Thread@HFlatten@Transpose@ M1TDD . odealongL


HFlatten@dM1@x1, L1T, M1TD . trackD . alongLD;

Length@ode3ED;

ode3F = Thread@HFlatten@Transpose@O1TDD . odealongL


HFlatten@dO1@x1, N1T, O1TD . trackD . alongLD;

Length@ode3FD;

ode3G = Thread@HFlatten@Transpose@Q1TDD . odealongL


HFlatten@dQ1@x1, R1T, Q1TD . trackD . alongLD;

Length@ode3GD;

force =
8H0.027 1 0.21851774999999998 Cos@1D 0.0675 2 Cos@1 1. 2D +
0.08939362499999999 Cos@1 1. 2D Cos@2D
0.00455625 Cos@1 1. 2D Sin@1 1. 2D d12
0.0018225000000000001 Sin@1 1. 2D d22 L
H0.00945 0.00455625 Cos@1 1. 2D2 L +
H35 + 1.1 Exp@ 50 Abs@d1DD + 0.9 H1 Exp@ 65 Abs@d1DDLL Sign@d1D,
H1. H 0.35 2 + 0.46352249999999995 Cos@2D 0.023625 Sin@1 1. 2D d12
0.0675 Cos@1 1. 2D
H 1. 1 + 8.09325 Cos@1D + 0.0675 Sin@1 1. 2D d22LLL
H0.00945 0.00455625 Cos@1 1. 2D2 L +
H38 + 1 Exp@ 55 Abs@d2DD + 0.95 H1 Exp@ 60 Abs@d2DDLL Sign@d2D<;

Control PD

0 = K.rT@x1D;

Control Neuronal
V1T;
x1;
W1T;
A1T;
B1T;
C1T;
D1T;
E1T;
F1T;
L1T;
M1T;
N1T;
O1T;
R1T;
Q1T;

165

NN@x_List, VT_List, WT_List, AT_List, BT_List, CT_List, DT_List, ET_List,


FT_List, LT_List, MT_List, NT_List, OT_List, RT_List, QT_ListD :=
WT.Extend@@VT.Extend@xDDD + BT.1@AT.Extend@xDD + DT.2@CT.Extend@xDD +
FT.3@ET.Extend@xDD + MT.1@LT.Extend@xDD + OT.2@NT.Extend@xDD +
QT.3@RT.Extend@xDD;

= NN@x1, V1T, W1T, A1T, B1T, C1T, D1T, E1T, F1T, L1T, M1T, N1T, O1T, R1T, Q1TD +
0 . track;
H =0.track; L
Dimensions;

Retroalimentacin
1 = @@1DD;
2 = @@2DD;

ForceAlong = force . along;

ode1 = 81 '@tD == d1@tD, 2 '@tD == d2@tD, d1 '@tD == ForceAlong@@1DD,


d2 '@tD ForceAlong@@2DD<;
ode = Join@ode1, ode2, ode3, ode3A, ode3B, ode3C, ode3E, ode3F, ode3GD;
Length@odeD;

odeA = Join@ode2, ode3, ode3A, ode3B, ode3C, ode3E, ode3F, ode3GD;


L = Length@odeAD;

vars = Join@81@tD, 2@tD, d1@tD, d2@tD<,


Table@v@iD@tD, 8i, 1, Length@Flatten@V1TDD<D,
Table@w@iD@tD, 8i, 1, Length@Flatten@W1TDD<D,
Table@w1@iD@tD, 8i, 1, Length@Flatten@B1TDD<D,
Table@w2@iD@tD, 8i, 1, Length@Flatten@D1TDD<D,
Table@w3@iD@tD, 8i, 1, Length@Flatten@F1TDD<D,
Table@w5@iD@tD, 8i, 1, Length@Flatten@ M1TDD<D,
Table@w6@iD@tD, 8i, 1, Length@Flatten@O1TDD<D,
Table@w7@iD@tD, 8i, 1, Length@Flatten@Q1TDD<DD;
Length@varsD;

varsini = Join@81@0D, 2@0D, d1@0D, d2@0D<,


Table@v@iD@0D, 8i, 1, Length@Flatten@V1TDD<D,
Table@w@iD@0D, 8i, 1, Length@Flatten@W1TDD<D,
Table@w1@iD@0D, 8i, 1, Length@Flatten@B1TDD<D,
Table@w2@iD@0D, 8i, 1, Length@Flatten@D1TDD<D,
Table@w3@iD@0D, 8i, 1, Length@Flatten@F1TDD<D,
Table@w5@iD@0D, 8i, 1, Length@Flatten@ M1TDD<D,
Table@w6@iD@0D, 8i, 1, Length@Flatten@O1TDD<D,
Table@w7@iD@0D, 8i, 1, Length@Flatten@Q1TDD<DD;
Lv = Length@varsiniD;

odeini =
Thread@varsini
Length@odeiniD;

Tmax = 15;

Join@80, 1, 0, 0<, Table@Random@Real, 8 0.1, 0.1<D, 8L<DDD;

166

sol = NDSolve@Join@ode, odeiniD, vars, 8t, 0, Tmax<, StartingStepSize 1 10000,


Method 8"FixedStep", Method "ExplicitRungeKutta"<, MaxSteps 1000000D;

G1 = Plot@Evaluate@81@tD, 2@tD< . solD, 8t, 0, Tmax<,


PlotStyle 8RGBColor@1, 0, 0D, RGBColor@0, 0, 1D<,
PlotRange 880, 15<, 8 1.2, 1.2<<,
GridLines 8None, 8 1, 1<<, PlotLabel "Angulos Rojo 1 y Azul 2"D;
G2 = Plot@8Sin@tD, Cos@tD<, 8t, 0, 15<D

Show@G1, G2, PlotRange 880, 15<, 8 1.2, 1.2<<D

Show@G1, G2, PlotRange 8811, 15<, 8 1.2, 1.2<<D

Plot@Evaluate@81@tD Sin@tD, 2@tD Cos@tD< . solD, 8t, 0, Tmax<,


PlotStyle 8RGBColor@1, 0, 0D, RGBColor@0, 0, 1D<,
PlotRange 880, 15<, 8 .00012, .00012<<,
GridLines 8None, 8 .0001, .0001<<, PlotLabel "Error Rojo 1 y Error Azul 2"D
Show@%, PlotRange 8812, 15<, 8 0.0001, .0001<<D

Plot@Evaluate@8d1@tD, d2@tD< . solD, 8t, 0, Tmax<,


PlotStyle 8RGBColor@1, 0, 0D, RGBColor@0, 0, 1D<,
PlotRange 880, 15<, 8 1, 1<<,
GridLines 8None, 80, 2<<,
PlotLabel "Velocidad de 1 Rojo; Velocidad de 2 Azul "D;

Show@%, PlotRange 886, 10<, 8 1, 1<<D

ParametricPlot@81@tD Sin@tD, 2@tD Cos@tD< . sol, 8t, 0, Tmax<,


AxesLabel 81, 2<, PlotStyle 8RGBColor@0, 1, 0D<D

167