Está en la página 1de 102

CENTRO DE INVESTIGACIÓN Y DE

ESTUDIOS AVANZADOS
DEL INSTITUTO POLITÉCNICO NACIONAL

DEPARTAMENTO DE CONTROL AUTOMÁTICO

Sistemas difusos jerárquicos para modelado y


control
TESIS QUE PRESENTA EL:

Ing. Fernando Gómez Salas

PARA OBTENER EL GRADO DE

MAESTRO EN CIENCIAS

EN LA ESPECIALIDAD DE

CONTROL AUTOMÁTICO

DIRECTOR DE TESIS:

Dr. Wen Yu Liu

México, D.F.
Octubre del 2005
Dedicatoria

A toda mi familia , por haberme apoyado en todo momento para el logro de mis objetivos.
ii
Agradecimientos

Deseo expresar mi gratitud a los esfuerzos de la gente que devotamente me ayudaron a


la realización de esta tesis
CINVESTAV: Antonio Osorio Cordero, José de Jesús Mesa Serrano, Noemí García
Gutiérrez, Graciela Meza Castellanos, Carlos Guerrero Rojo y Sheila Montiel.
A mis asesores: Dr. Francisco José Ruiz Sánchez y al Dr. Ieroham Barouh por las
críticas constructivas para mejorar el presente trabajo
A Mis amigos : Beto, Edgar, Armando, Gabriela, Roxana, Omar, Laura, Saraí, Rosa,
Sheila y Rigoberto.
Mil gracias a mi familia: A mis abuelos Jorge Salas y Margarita Zúñiga, a mis padres
Antonia Salas y Ernesto Gómez, a mis tíos Roberto Salas, Carmen Salas y Miguel Salas, a
mi hermano Israel Gómez y a mis primos Zoe, Zaira, Laura, Pepe y Bruno.
Por último mi especial gratitud al Dr. Wen Yu Liu por dirigirme en este trabajo de tesis
y enseñarme lo difuso que suele ser la vida.
Mil gracias al CONACYT por apoyarme con una beca, sin la cuál no hubiera sido posible
terminar este trabajo de tesis y al departamento de Control Automático por proporcionarme
los medios necesarios para mi formación académica y por las facilidades otorgadas durante
mi estancia.
iv
Resumen

En este trabajo se presenta un algoritmo jerárquico de aprendizaje tipo backpropagation


para la identificación de sistemas sin utilizar estructuras complejas de entrenamiento y un
algoritmo para el diseño de controladores difusos jerárquico. Este nuevo esquema de apren-
dizaje es aplicado a sistemas de identificación vía aprendizaje difuso jerárquico. El algoritmo
de aprendizaje emplea un factor de aprendizaje de tiempo variable, el cual es determinado
a partir de los datos de entrada-salida y a partir de la estructura del sistema. Este método
sugiere ser más sencillo que el aprendizaje normal debido a su estructura jerárquica, lo que
implica que podemos entrenar exactamente los parámetros de cada sub-bloque del sistema
jerárquico independientemente. Por otra parte, el algoritmo para el diseño de controladores
difusos jerárquicos es desarrollado de tal forma que uno puede fácilmente diseñar las reglas
difusas del sistema en forma jerárquica mediante el uso del método de mapeo de variables
y un índice de aproximación φ. En contraste con el método convencional de una sola capa,
el nuevo método llamado jerárquico, posee la gran ventaja de que el número de reglas del
sistema solamente se incrementa linealmente con el número de variables de entrada.
La efectividad del método propuesto para la identificación de sistemas se verifica a través
de un ejemplo de cinco dimensiones y mediante la predicción de una serie de tiempo de tipo
Mackey-Glass. De manera similar para mostrar la efectividad del algoritmo correspondiente
al diseño de controladores difusos jerárquicos, el algoritmo propuesto se valida a través del
diseño de un controlador difuso jerárquico para el sistema riel-esfera. Los resultados de las
simulaciones se presentan para ilustrar la efectividad y la confiabilidad de estos algoritmos.
vi
Índice general

1. Introducción 1
1.1. Motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2. Justificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3. Descripción de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2. Sistemas difusos 7
2.1. Estructura de los sistemas difusos . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.1. Fuzzificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.1.2. Mecanismo de inferencia difusa . . . . . . . . . . . . . . . . . . . . . 9
2.1.3. Defuzzicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2. Tipos de Sistemas difusos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.1. Mamdani . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2.2. Takagi-Sugeno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3. Conclusiones del capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3. Sistemas difusos jerárquicos vía aprendizaje para identificación de sis-


temas 19
3.1. El sistema difuso jerárquico . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.2. Identificación de sistemas vía aprendizaje difuso jerárquico . . . . . . . . . . 21
3.2.1. Error backpropagation . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2.2. Algoritmo para identificación de sistemas no lineales . . . . . . . . . 28
viii ÍNDICE GENERAL

3.3. Aprendizaje de un controlador en sistemas difusos . . . . . . . . . . . . . . . 30


3.4. Simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4.1. Ejemplo de cinco dimensiones . . . . . . . . . . . . . . . . . . . . . . 32
3.4.2. Predicción de una serie de tiempo tipo Mackey-Glass . . . . . . . . . 36
3.5. Conclusiones del capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4. Sistemas difusos jerárquicos vía mapeo de variables para control difuso 43


4.1. El sistema de estructura jerárquica . . . . . . . . . . . . . . . . . . . . . . . 44
4.2. El sistema difuso limpio-jerárquico L-HFS . . . . . . . . . . . . . . . . . . . 46
4.2.1. Algoritmo para la construcción del sistema difuso límpido-jerárquico . 51
4.3. Aplicación del L-HFS al sistema riel-esfera . . . . . . . . . . . . . . . . . . . 53
4.3.1. El sistema riel-esfera . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.3.2. Implementación del algoritmo L-HFS . . . . . . . . . . . . . . . . . . 55
4.4. Aplicación en tiempo real . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.4.1. Descripción del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.4.2. Construcción del controlador difuso jerárquico para el sistema riel-esfera 67
4.4.3. Implementación al sistema real y resultados experimentales . . . . . . 73
4.5. Conclusiones del capítulo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

5. Conclusiones y trabajos futuros 81


5.1. Trabajos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
Índice de figuras

2.1. Esquema general del control difuso. . . . . . . . . . . . . . . . . . . . . . . . 8


2.2. Función de membresía del singleton. . . . . . . . . . . . . . . . . . . . . . . . 9

3.1. (a) y (b) Representación para el sistema lógico difuso jerárquico; (c) repre-
sentación para el sistema lógico difuso convencional de una sola capa. . . . . 20
3.2. Sistema difuso jerárquico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.3. Un sistema difuso jerárquico para identificación. . . . . . . . . . . . . . . . . 26
3.4. Entrenamiento en el caso general para la identificación de sistemas. . . . . . 29
3.5. Diagrama a bloques que representa el aprendizaje de tipo Off-Line. . . . . . . 30
3.6. Entrenamiento para sistemas de control usando sistemas difusos jerárquicos. 31
3.7. Estructura jerárquica difusa para identificar el sistema no lineal definido por
( 3.11). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.8. Identificación para una sistema difuso jerárquico con 2+2+2=6 reglas difusas. 34
3.9. Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de cinco
dimensiones cuando 0<t<55. . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.10. Identificación para un sistema difuso convencional con 12 reglas difusas. . . . 35
3.11. Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de cinco
dimensiones cuando 0<t<55. . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.12. Comparación del desempeño entre los métodos convencional y jerárquico para
el ejemplo de cinco dimensiones. . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.13. Estructura jerárquica difusa para identificar la serie de tiempo Mackey-Glass. 37
x ÍNDICE DE FIGURAS

3.14. Identificación para un sistema difuso jerárquico con 2+2+2=6 reglas difusas. 38
3.15. Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de predic-
ción en una serie de tiempo tipo Mackey-Glass cuando 0<t<55. . . . . . . . 38
3.16. Identificación para un sistema difuso convencional con 12 reglas difusas. . . . 39
3.17. Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de predic-
ción en una serie de tiempo tipo Mackey-Glass cuando 0<t<55. . . . . . . . 39
3.18. Comparación del desempeño entre los métodos convencional y jerárquico para
la predicción de una serie de tiempo tipo Mackey-Glass . . . . . . . . . . . . 40

4.1. Arquitectura de un controlador difuso a) Sistema de control b) Control difuso


convencional y c) Control difuso jerárquico. . . . . . . . . . . . . . . . . . . 44
4.2. Sistema difuso jerárquico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.3. Sistema de lógica difusa de estructura jerárquica. . . . . . . . . . . . . . . . . 45
4.4. Diagrama a bloques de un sistema difuso jerárquico (HFS). . . . . . . . . . . 47
4.5. Reglas mediante el acceso aleatorio. . . . . . . . . . . . . . . . . . . . . . . . 48
4.6. El proceso de reducción. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4.7. La relación de los renglones y las variables de mapeo. . . . . . . . . . . . . . 49
4.8. Reglas para F1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.9. Reglas para F2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.10. Diagrama de un HFS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.11. Un número triangular difuso en donde a1 , a2 y a3 describen respectivamente
la tripleta (a1 , a2 , a3 ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.12. Sistema riel-esfera. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.13. Estructura del HFS para el sistema riel-esfera. . . . . . . . . . . . . . . . . . 55
4.14. Las reglas del ejemplo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.15. Funciones de membresía para las variables de entrada y salida. . . . . . . . . 57
4.16. Unidades F1 ,F2 y F3 y número de reglas. . . . . . . . . . . . . . . . . . . . . 58
4.17. Funciones de membresía tipo triangular para µr (x) y µṙ (x) y función de mem-
bresía resultante para µr∧ṙ (x) = mı́n(µr (x), µṙ (x)). . . . . . . . . . . . . . . . 60
ÍNDICE DE FIGURAS xi

4.18. Reestructura para la base de reglas de una sola capa . . . . . . . . . . . . . . 63


4.19. Nuevas reglas para Fr , Fθ y Fu . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.20. Funciones de membresía para las variables de salida; (a) Funciones de salidas
(b) Gráfica de la operación ( P OR PG ); (c) Gráfica de la operación ( P OR
NG ); (d) Gráfica de la operación ( PG OR N ); (e) Gráfica de la operación
( PG OR PG ) y (f) (b) Gráfica de la operación ( NG OR NG ). . . . . . . 64
4.21. Descripción del sistema riel esfera. . . . . . . . . . . . . . . . . . . . . . . . 66
4.22. Estructura del jerárquica para el sistema barra-esfera en tiempo real. . . . . . 67
4.23. Reglas difusas para el ejemplo en tiempo real del sistema riel-esfera . . . . . . 69
4.24. Unidades Fr , Fθ y Fu para el sistema barra-esfera. . . . . . . . . . . . . . . . 70
4.25. Tipos de funciones de membresía para el sistema barra esfera.(a) Membresías
de entrada para la variable r (b) Membresías de entrada para la variable ṙ (c)
Producto algebraico A∗ = A · B y (c) Producto algebraico B ∗ = C · D. . . . . 72
4.26. Tipos de funciones de membresía para el sistema barra esfera.(a) Membresías
de entrada para la variable θ (b) Membresías de entrada para la variable θ̇ (c)
Producto algebraico C ∗ = E · F y (c) Producto algebraico D∗ = G · H. . . . . 72
4.27. El sistema riel-esfera. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.28. Diagrama a bloques en simulink para el controlador en tiempo real del sistema
riel-esfera usado por Ortiz [22]. . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.29. Diagrama de bloques en simulink para el controlador en tiempo real del sistema
riel-esfera jerárquico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.30. Diagrama de bloques en simulink para el controlador en tiempo real del sistema
riel-esfera de lógica convencional. . . . . . . . . . . . . . . . . . . . . . . . . 76
4.31. Resultados de la aplicación en tiempo real del sistema barra-esfera. (a) Sistema
difuso jerárquico de 12 reglas y (b) sistema difuso convencional de una sola
capa de 16 reglas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.32. Señal de control (a) para el sistema difuso jerárquico y (b) para el sistema
convencional de la lógica difusa. . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.33. Salida de control PD-difuso para el sistema riel-esfera. . . . . . . . . . . . . 78
xii ÍNDICE DE FIGURAS

4.34. Salida de control PD para el sistema riel-esfera. . . . . . . . . . . . . . . . . 78


Capítulo 1

Introducción

Desde que el control difuso fue propuesto por E. H. Mamdani en 1974, diferentes estu-
dios aplicados a la teoría del control difuso han mostrado que el aprendizaje difuso y/o los
algoritmos de control difuso son de las áreas más activas y fructíferas de la investigación en
los últimos años dentro del campo de la lógica difusa. A partir de la década de los ochentas,
la lógica difusa ha desempeñado una función vital en el avance de soluciones prácticas y sen-
cillas para una gran diversidad de aplicaciones en la ingeniería y la ciencia. Debido a su gran
importancia en los sistemas de navegación de vehículos espaciales, control de vuelo, control
satelital de altitud, control de velocidad en mísiles y similares, el área de la lógica difusa se
ha vuelto una parte importante e integral de los procesos industriales y de manufactura.
Desde el punto de vista conceptual, el diseño de sistemas difusos a partir de los pares
de entrada-salida, han sido clasificados en dos tipos. El primer tipo de clasificación sugiere
que las reglas del tipo Si − entonces sean generadas a través de los pares de entrada-salida
y la estructura del sistema difuso sea construida a partir de estas reglas, del mecanismo
de inferencia difusa, del fuzzificador y del defuzzificador. En la segunda clasificación, la
estructura del sistema difuso se especifica primeramente por lo que algunos parámetros en la
estructura difusa son libres de cambio y estos se determinan de acuerdo a los pares de entrada-
salida. Aunque regularmente algunas aplicaciones del control difusos a procesos industriales
han producido resultados superiores a sus equivalentes obtenidos por el control clásico [25],
2 Introducción

el dominio de estas aplicaciones ha experimentado una seria limitación al expander este a


sistemas más complejos, debido a que aún no existe una teoría completa para determinar el
rendimiento del sistemas a partir del cambio en sus parámetros o variables.
Sin embargo, al expandir algunas de estas aplicaciones a sistemas más complejos, el
número de reglas difusas relacionadas con el proceso se incrementan de forma exponencial
con el número de variables relacionadas al sistema. Específicamente este problema llamado
la maldición de la dimensionalidad1 establece que con el uso de n variables y m conjuntos
definidos por cada variable, se necesitarían mn reglas difusas para construir un controlador
difuso completo, i.e., conforme n crece, la base de reglas rápidamente sobrecarga la memoria
de cualquier dispositivo de computo haciendo que el controlador difuso sea difícil de imple-
mentar además de que se define un tiempo de respuesta imposible para procesos rápidos en
tiempo real [37] [35] [36].
Para tratar este problema Raju, Zhou, y Kisner propusieron el uso de sistemas difusos
jerárquicos [37] [3], los cuales consisten en un número de sistemas difusos de baja dimensión
conectados uno a otro de forma jerárquica. La ventaja que propone este enfoque jerárquico
para los sistema difusos, es que el número total de reglas difusas del controlador se incrementa
solamente de forma lineal con el número de variables de entrada y por tanto que sea más
sencillo de implementar reduciendo así el costo computacional y consecuentemente el tiempo
de computo.

1.1. Motivación
Debido al efecto tecnológico causado por el uso de las computadoras a partir de la década
de los 80´s y 90´s, el uso de controladores automáticos asistidos por microcomputadoras
ha crecido considerablemente en muchas de las aplicaciones industriales y militares de la
actualidad. En la gran mayoría de los casos, un control computarizado genera una acción
rápida y precisa de control para sistemas de control basados en la experiencia, sin embargo
1
Esta expresión no es única de los sistema difusos y establece lo siguiente:
“La complejidad de un problema incrementa exponencialmente con el número de variables relacionadas”.
1.1 Motivación 3

estas acciones se realizan generalmente con una baja calidad en el control comparadas con
la habilidad mostrada por un operador humano experto. Para resolver este problema, los
métodos del control difuso hicieron posible que los ingenieros tuvieran herramientas para
diseñar sistemas de control de excelente calidad, sin embargo, conforme las plantas modernas
con múltiples entradas y salidas se han vuelto más y más complejas, la implementación de este
tipo de controladores se ha tornado más difícil debido a la maldición de la dimensionalidad.
Las limitaciones causadas por la maldición de la dimensionalidad, sugirieron una nueva
metodología para el diseño de sistema difusos a través del uso de una estructura jerárquica.
Aunque los sistemas difusos jerárquicos denotan ser la mejor opción para evitar el crecimiento
del número de reglas difusas de forma exponencial, algunos de estos métodos usan estructuras
complejas y en algunos casos estos abarcan solamente algunos problemas específicos.
La finalidad del presente trabajo, es la de dar a conocer un nuevo algoritmo jerárquico
de aprendizaje tipo backpropagation para la identificación de sistemas no lineales sin utilizar
estructuras complejas de entrenamiento y la de ofrecer una metodología del nuevo enfoque
difuso jerárquico mediante el diseño un controlador difuso en tiempo real para el sistema
riel-esfera. Este sistema se utiliza para ejemplificar y justificar el desarrollo de esta tesis,
en particular, el prototipo esta ubicado en el Centro de Servicios Experimentales (CSE) del
Departamento de Control Automático (DCA) del CINVESTAV-IPN.
Finalmente mencionaremos los casos en los que es necesario utilizar sistemas difusos
jerárquicos:

1. En procesos complejos, gran número de variables de entrada y/o salida.

2. En procesos no lineales complejos.

3. Cuando la introducción de la experiencia de un “experto” se base en una gran cantidad


de variables imprecisas obtenidos a partir de su experiencia.

4. Cuando sea necesario optimizar recursos (memoria del controlador).

5. En general, cuando se quieran representar y operar con una gran variedad de parámet-
ros que tengan cierto grado de imprecisión o incertidumbre.
4 Introducción

1.2. Justificación
Al leer algunos artículos y libros de texto referentes a la teoría del control difuso, el
lector crea una opinión acerca de como trabaja y se desempeña el control lógico difuso. En lo
particular, es fácil observar que la mayoría de la literatura no ofrece los suficientes conceptos
fundamentales sobre la teoría difusa y el control difuso. Sin embargo, cuando el lector localiza
cuales son estos conceptos, este comienza a adquirir una opinión diferente acerca de ¿cómo?
y cuando el control difuso trabaja, además de la habilidad para reconocer cuando este es más
práctico2 que el control convencional. De acuerdo con D. Abramovithc 1994 [1], es claro que
la lógica difusa puede ser mucho más útil de lo que sus opositores harían creer. Cualquier
aplicación candidata al control difuso es aquella que relacione una “interacción humana” y
una “regla de control” previamente establecida, i.e., estos son problemas donde la diferencia
entre el bien y el mal no es binaria. En la actualidad, el uso del control difuso convencional
satisface el objetivo de controlar cualquier proceso basado en la información cualitativa de
los procesos.
Aunque el creciente número de aplicaciones de los controladores difusos han sido re-
stringidos en gran medida a la falta de seguridad en su desempeño, en los últimos años el
mundo actual ha sido incitado en considerar y aplicar esta área para su uso en los sistemas de
control. En contraste con el controlador difuso convencional, el controlador difuso jerárquico
no sólo controla el sistema deseado de forma adecuada, sino que también reduce el efecto
causado por la maldición de la dimensionalidad, de tal forma que permite la implementación
del controlador difuso en forma práctica y sencilla. Por otra parte, la construcción de sis-
temas difusos en jerarquías, ofrecen la grandes recompensas de modelar no linealidades sin
la necesidad de emplear algoritmos complejos y por supuesto el de dar soporte a algunos
controladores convencionales en donde el margen de error es crítico.
Finalmente existen algunos problemas, en donde, los sistema de control han sido diseñado
específicamente para trabajar bajo el control de un operador humano. Mediante el uso de
sensores extras y tiempos de muestreo más rápidos que los ofrecidos por un operador humano,

2
En costo e implementación.
1.3 Descripción de la tesis 5

el control difuso fácilmente ofrece el mismo desempeño realizado por este último. Es por
tanto, que la contribución real que ofrecen los sistemas difusos jerárquicos a las áreas de la
ingeniería, ciencia, negocios, medicina, psicología y similares, es de suma importancia en la
actualidad.

1.3. Descripción de la tesis


Este trabajo de tesis que se presenta, consiste de temas distribuidos en cinco capítulos,
divididos de la siguiente manera:
En el capítulo 1 se realiza una breve introducción al tema de tesis. En el capítulo 2, se
da una introducción referente al concepto de sistema difuso y a los mecanismos de inferencia
difusa tipo Sugeno y Mamdani. El capítulo 3, muestra la motivación de utilizar los sistemas
difusos jerárquicos para la identificación de sistemas, además de tratar el análisis completo
para la construcción del algoritmo jerárquico de aprendizaje tipo-backpropagation para la
identificación de sistemas. Este capítulo, también incluye un par de ejemplos para mostrar
la efectividad de método propuesto. En el capítulo 4 se aborda el análisis y la justificación
de los sistemas difusos jerárquicos en los esquemas de control mediante el uso de variables de
mapeo. Este capítulo también presenta el diseño y la implementación de un algoritmo para
el diseño de controladores difusos jerárquicos. Al final del mismo, se presenta la aplicación
en tiempo real para mostrar la efectividad del algoritmo propuesto. Por último, el capítulo 5
describe las conclusiones generales del trabajo realizado y las perspectivas de investigación
para trabajos futuros.
6 Introducción
Capítulo 2

Sistemas difusos

El sistema de inferencia difusa es una estructura computacional muy popular basada en


los conceptos de la teoría difusa, en reglas del tipo si-entonces y en métodos de inferencia
difusa. Los sistemas de inferencia difusa, actualmente han encontrado diversas aplicaciones
exitosas dentro de una gran variedad de áreas tales como el control automático, la clasificación
de datos, el análisis de decisiones, los sistemas expertos, la predicción de series de tiempo,
la robótica y en el reconocimiento de patrones. A causa de su naturaleza multidisciplinaria,
los sistemas de inferencia difusa son conocidos como sistemas experto, modelos difusos,
controladores lógicos difusos o simplemente como sistemas difusos.

2.1. Estructura de los sistemas difusos


Motivado por Zadeh y validado por Mamdani, el uso de los sistemas difusos han sido
aplicados en una gran variedad de áreas tales como el control automático, el procesamiento
digital de señales, las comunicaciones, los sistemas expertos, la medicina, etc. Sin embargo,
las aplicaciones más significativa de los sistemas difusos se han concentrado específicamente
en el área del control automático.
Esencialmente un sistema difuso, es una estructura basada en conocimiento definida
a través de un conjunto de reglas difusas del tipo si-entonces, las cuales, contienen una
8 Sistemas difusos

Controlador difuso
Base de reglas

ui yi
Fuzzificador Deffuzificador

Mecanismo
de
difuso inferencia difuso

Salida del proceso y estado Control actual no difuso


Proceso

Figura 2.1: Esquema general del control difuso.

cuantificación lógica difusa de la descripción lingüística del experto de como realizar un


control adecuado.

La figura 2.1 ilustra el diagrama a bloques y los componentes básicos de un sistema difuso
en donde los conjuntos clásicos Ui y Yi son llamados el universo del discurso para ui y yi
respectivamente. En particular, ui ∈ Ui con i = 1, 2, 3, ..., n y yi ∈ Yi con i = 1, 2, ..., m
definen las entradas y salidas correspondientes del sistema difuso.

De acuerdo a la figura 2.1, es fácil observar que el sistema difuso utiliza conjuntos difusos,
definidos por la base de reglas difusa, para cuantificar la información en la base de reglas
y que el mecanismo de inferencia opera sobre estos conjuntos difusos para producir nuevos
conjuntos difusos, por tanto, es necesario especificar como el sistema convertirá las entradas
numéricas ui ∈ Ui en conjuntos difusos, un proceso llamado “fuzzificación”, tales que ellos
puedan ser utilizados por el sistema difuso. De igual forma, el proceso llamado defuzzificación
describe el mapeo de un espacio de acciones de control difuso en acciones de control no difuso.
La defuzzificación por tanto, genera una acción de control no difusa la cual denotamos
generalmente por yqcrisp y es la mejor representación de una salida difusa inferida.

A continuación examinaremos en detalle los elementos que conforman un sistema difuso.


2.1 Estructura de los sistemas difusos 9

Figura 2.2: Función de membresía del singleton.

2.1.1. Fuzzificación
El proceso de la fuzzificación consiste en una transformación de un dato o de un conjunto
clásico a su correspondiente conjunto difuso, por tanto, denotemos por Ui∗ , el conjunto de
todos lo posibles conjuntos difusos que pueden ser definidos por Ui y dado ui ∈ Ui , denotemos
la transformación difusa de ui a un conjunto difuso por Afi uz , el cual es definido en el universo
del discurso Ui .
La transformación de un conjunto clásico a un conjunto difuso se produce mediante el uso
del operador de fuzzifiación F, Passino [23], definido por F : Ui → Ui∗ en donde F(ui ) = Afi uz .
Regularmente el uso del fuzzificador tipo singlenton es el más utilizado para las aplica-
ciones en área del control automático y este es definido como un conjunto difuso Afi uz ∈ Ui∗
con función de membresía
(
1 si x = ui
µAf uz (x) = . (2.1)
i
0 en otro caso
Cualquier conjunto difuso con la forma (2.1) en su función de membresía es llamado “sin-
glenton1 ”, figura (2.2).

2.1.2. Mecanismo de inferencia difusa


El mecanismo de inferencia difusa es el núcleo de cualquier controlador difuso. Su com-
portamiento dinámico es en general caracterizado por un conjunto de reglas difusas de la
1
Note que la función discreta impulso puede ser utilizada para representar la función de membresía de
un singlenton.
10 Sistemas difusos

forma
Si x es A entonces y es B (2.2)

en donde A y B son valores lingüísticos definidos por un conjunto difuso en un universo


X y Y respectivamente. La cláusula Si, un antecedente, es una condición en el dominio de
aplicación; la cláusula entonces, una consecuencia, es una acción de control dado al proceso
bajo control.
Con un conjunto de reglas difusas, el mecanismo de inferencia difusa es capaz de derivar
una acción de control para un conjunto de valores de entrada. En otras palabras, una acción
de control es determinada por las entradas observadas, las cuales representan el estado del
proceso a ser controlado mediante el uso de las reglas de control.
La expresión “Si x es A entonces y es B”, la cual se abrevia regularmente como A → B,
en esencia, es una relación binaria R de las variables x y y en el espacio del producto X × Y .
Existen diversos métodos de inferencia difusa que pueden ser formulados a través de los
operadores2 t-norma y s-norma para calcular la relación difusa R=A → B. En general, los
siguientes métodos son los más utilizados:

1. Implicación de Dienes-Rescher [28]: En esta implicación la regla difusa (2.2) es inter-


pretada como una relación RD en A × B con función de membresía

µRD (x, y) = máx[1 − µA (x), µB (y)] (2.3)

2. Implicación Lukasiewics [28]: Específicamente, la regla difusa (2.2) es interpretada como


una relación difusa RL en A × B con función de membresía

µRL (x, y)= mı́n[1, 1 − µA (x) + µB (y)] (2.4)

3. Implicación de Zadeht [28]: Aquí la regla difusa (2.2) es interpretada como una relación
difusa RZ en A × B con función de membresía

µRL (x, y) máx [mı́n(µA (x), µB (y)), 1 − µA (x)] (2.5)


2
Vea [14] y [15] para más información acerca de estos operadores.
2.1 Estructura de los sistemas difusos 11

4. Implicación Mamdani [28]: La regla difusa (2.2) es interpretada como una relación RM
en A × B con función de membresía

µRM (x, y) = mı́n [µA , µB ] , ó µRM = µA (x) · µB (x) (2.6)

Aunque estas cuatro ecuaciones representan diferentes interpretaciones de la regla di-


fusa (2.2), la implicación de Mamdani, es la más utilizada para aplicaciones en los
sistemas difusos, ecuación (2.6).

En general el operador inferencia se aproxima por medio de una t-norma.

2.1.3. Defuzzicación
La defuzzificación es definida como un mapeo de un conjunto difuso B 0 en V ⊂ R (que
es la salida de la inferencia difusa) a un elemento de un conjunto clásico yqcrisp = y ∗ ∈ V.
Conceptualmente, la tarea de defuzzificar es especificar un punto, elemento de V, que refleje
la mejor representación del conjunto difuso B 0 . A la fecha no existe un algoritmo óptimo para
la defuzzificación, sin embargo, algunos métodos de defuzzifiacación son prácticos. Como es
común, a continuación detallaremos dos de las técnicas más utilizadas para la defuzzificación.

El defuzzificador centro de gravedad (COG): especifica la salida y ∗ como el


centro del área cubierta por la función de membresía del conjunto difuso B, y esta es
dada por Y
PR q
b
i=1 i µ i (yq )dyq
yq B̂q
y ∗ = yqcrisp = PR Y (2.7)
i=1 (yq )dyq
yq

en donde R es el número de reglas difusas, bqi es el centro del área de la función de


membresía de BqP asociado con el conjunto difuso implicado B̂qi para la i − ésima
regla3 (j, k, ..., l; p, q)i , y
Y
µB̂qi (yq )dyq (2.8)
yq

3
Por simplicidad usaremos (j, k, ..., l; p, q)i = Ri para denotar la i − ésima regla difusa de una base de
reglas difusa tipo MISO.
12 Sistemas difusos

denota el área bajo µB̂qi (yq ). Note que el sistema difuso debe ser definido tal que

X
R Y
µB̂qi (yq )dyq 6= 0 (2.9)
i=1 yq

para toda ui , o la salida yqcrisp , no será definida apropiadamente. Este valor no debe
ser cero si existe una regla seleccionada para cada posible combinación de las entradas
del sistema difuso y si todo el conjunto difuso de la consecuencias tiene área distinta
de cero.

Defuzzificador centro promedio: El defuzzificador centro promedio determina la


salida clásica yqcrisp usando los centros de cada salida de la funciones de membresía. El
valor óptimo o máximo de cada conclusión es representada mediante el conjunto difuso
implicado: n o
PR q
supyq µB̂qi (yq )
i=1 bi
yqcrisp = P n o (2.10)
R
i=1 supyq µ i
B̂q (yq )
donde el “sup” denota el supremo (supx {µ(x)} puede ser simplemente pensado como
al valor más alto de µ(x)) y bqi es el centro del área de la función de membresía de BqP
asociado con el conjunto de implicación difusa B̂qi para la i−ésima regla (j, k, ..., l; p, q)i .
Note que el sistema difuso pude ser definido como

X
R n o
bqi sup µB̂qi (yq ) 6= 0 (2.11)
yq
i=1
n o
para toda ui , en donde el supyq µB̂qi (yq ) es regularmente fácil de calcular si µB̂qi (yq ) =
1 para al menos un yq , entonces para varias estrategias de inferencias podemos utilizar
los cálculos4 correspondientes para la i − ésima regla (j, k, ..., l; p, q)i por lo que el
conjunto difuso de implicaciones B̂qi es definido en su función de membresía como

µB̂qi (yq ) = µi (µ1 , µ2 , ..., µn ) ∗ µBqP (yq ) (2.12)


4
Para ver los cálculos correspondientes al conjunto difuso B̂qi véase [23].
2.2 Tipos de Sistemas difusos 13

y obtener
n o
sup µB̂qi (yq ) = µi (µ1 , µ2 , ..., µn ) (2.13)
yq

Por lo tanto, la ecuación para la defuzzificación centro promedio esta dada por
PR q
bi µi (u1 , u2 , ..., un )
yqcrisp = Pi=1
R
(2.14)
i=1 µi (u1 , u2 , ..., un )

PR
donde se debe asegurar que i=1 µi (u1 , u2 , ..., un ) 6= 0 para toda ui .

2.2. Tipos de Sistemas difusos


En estas sección se presentan los controladores difusos de tipo Mamdani y Sugeno, los
cuales han sido utilizados exitosamente en una gran variedad de aplicaciones en la comunidad
del control difuso. Aunque, el objetivo del controlador difuso Mamdani es el de representar
a un exitoso operador humano, el controlador difuso de tipo Sugeno sugiere ser más eficiente
en cálculos y en métodos de adaptación (learning).

2.2.1. Mamdani
En esta subsección definiremos la construcción de un sistema difuso tipo Mamdani.
Primero, considérese una base de reglas difusas del tipo MISO descritas por (2.15)

R1 : Si u1 es Aj1 y u2 es Ak2 y,..., y un es Aln entonces y1 es B1r


..
.
Rj : Si u1 es Aj1 y u2 es Ak2 y,..., y un es Aln entonces yj es Bjs (2.15)
..
.
Rm : Si u1 es Aj1 y u2 es Ak2 y,..., y un es Aln entonces ym es Bm
t

en donde Aji , Ak2 ,..., Aln y Bjs para Rj , representan los valores lingüísticos correspondientes,
Passino [23].
14 Sistemas difusos

Si la entrada al sistema difuso es dado por

ui = x∗i (2.16)

entonces, haciendo uso del fuzzificador singlenton


(
1 si xi = x∗i
µ= (2.17)
0 en otro caso

se tiene que
¡ ¢
ui es Aji → µAj (x∗i ) (2.18)
i

en donde Aji denota el valor lingüístico correspondiente a la i− ésima entrada de la j − ésima


regla difusa Rj correspondiente a la base de reglas difusas descritas por (2.15). Al hacer uso
de la ecuación (2.16), la j − ésima regla difusa de la base de reglas (2.15) es representa por

Rj : Si x∗1 es Aj1 y x∗2 es Ak2 y,..., y x∗n es Aln entonces yj es Bjs (2.19)

en donde la operación difusa de la j − ésima regla (2.19) es definida por


Y
n
µAj (x∗i ) (2.20)
i
i

El motor de inferencia difusa que utiliza esta base de reglas difusas es el mecanismo de
inferencia del producto o implicación de Mamdani, por lo que para la j − ésima regla se
tiene que:
Y
n
µAj (x∗i ) µB̃j (y) (2.21)
i
i

y la l−regla p se obtiene mediante el operador “OR”


" n #
M Y
µp = máx µAj (x∗i ) µB̃j=l (y) (2.22)
l=1 i
i

en donde el índice M representa el número de reglas para (2.15) y B̃js denota el valor lingüís-
tico correspondiente a la salida yj de la j − ésima regla difusa Rj , con j = l.
2.2 Tipos de Sistemas difusos 15

El método de defuzzificación puede ser obtenido suponiendo que y j es centro de B̃j , la


altura de la l − regla del conjunto difuso es

Y
n
¡ ¢
µAj (x∗i ) µBj y j (2.23)
i
i

y
¡ ¢
µB̃j y j = 1 (2.24)

es un conjunto difuso normalizado, sustituyendo la ecuación (2.24) en la ecuación (2.23) se


obtiene que el centro promedio es dado por
à n !
X
m Y
yj µAj (x∗i )
i
∗ j=1 i
y = Ã n !
X
m Y
µAj (x∗i )
i
j=1 i

Teorema 2.1 Sistemas difusos con base de reglas difusas, mecanismos de inferencia tipo
producto, fuzzificador singlenton y defuzzificador centro promedio poseen el siguiente mapeo
no lineal à n !
X
m Y
yj µAj (xi )
i
crisp j=1 i
y = m à n ! (2.25)
X Y
µAj (xi )
i
j=1 i

2.2.2. Takagi-Sugeno
El modelo difuso de Takagi-Sugeno (también conocido como modelo TKS) fue propuesto
por Takagi, Sugeno y Kang [9], en un esfuerzo para formalizar un método sistemático para
generar reglas difusas a partir de un conjunto de datos de entradas y salidas. Una típica
regla difusa en el modelo de Sugeno tiene la forma

Si x es A y y es B entonces z = f (x, y) (2.26)


16 Sistemas difusos

donde A y B son conjuntos difusos en el antecedente, mientras z = f (x, y) es una función


clásica en la consecuencia. Usualmente f (x, y) es un polinomio en la variables de entrada x y
y, pero este puede ser cualquier función mientras pueda describir apropiadamente la salida del
modelo dentro de la región difusa especificada por la regla de antecedentes. Cuando f (x, y)
es un polinomio de primer orden, el sistema resultante de inferencia difusa es llamado modelo
difuso de Sugeno de primer orden. Cuando f es una constante, entonces tenemos un modelo
difuso de Sugeno de orden cero, el cual puede ser visto como un caso especial de la regla de
inferencia difusa de Mamdani, en la cual cada regla es especificada por un singletón (o una
consecuencia pre-defuzzificadora ), o un caso especial del modelo Tsukamoto. Sin embargo,
un modelo de Sugeno de orden cero es equivalente a una red de funciones básica radiales.
Un caso especial del modelo difuso lingüístico se obtiene cuando la consecuencia, el con-
junto difuso Bi , es formado por conjuntos difusos de singlentones. Estos sistemas se repre-
sentan simplemente como números reales bi , obteniéndose las siguientes reglas:

Ri : Si x es Ai entonces y = bi , i = 1, 2, ..., K. (2.27)

Este modelo se llama modelo singletón. Un método simplificado de inferencia-defuzzificación


se utiliza generalmente con este modelo:
PK
β i bi
y = Pi=1
K
(2.28)
i=1 β i

Este método de defuzzification se llama el medio difuso “fuzzy mean”. El modelo difuso del
singleton pertenece a una clase general de las funciones aproximadoras, llamadas la extensión
de las funciones básicas (Friedman, 1991) tomando la forma:

X
K
y= φ(x)bi (2.29)
i=1

La mayoría de las estructuras usadas en la identificación de sistemas no lineales, tales como


las redes neuronales artificiales, las redes neuronales de funciones básicas radiales [8], o tiras
(splines), pertenecen a esta clase de sistemas.
2.3 Conclusiones del capítulo 17

2.3. Conclusiones del capítulo


En este capítulo, se discutió en gran detalle la estructura de los sistemas difuso y dos
de los mecanismos de inferencia difusa más utilizados en la comunidad del control difuso: el
modelo difuso Sugeno y el modelo difuso Mamdani.
De acuerdo a la primera sección, es fácil observar que el sistema de inferencia difusa es
una de las herramientas de modelado más importantes del control difuso debido a que su
estructura se basa estrictamente en la teoría de la lógica difusa.
Por otra parte, los sistemas de inferencia difusa definidos aquí, basados en alguno de
los métodos propuestos, dan la posibilidad de representar conceptualmente el mejor mapeo
no lineal de salida de un sistema difuso con el objetivo de simular el conocimiento de un
operador humano experto a un bajo costo y eficientemente sin la necesidad de reemplazar al
operador debido a largas jornadas de trabajo.
En el siguiente capítulo, el modelo de inferencia Mamdani será usa elaborar la construc-
ción de un método tipo-backpropagation en la identificación de sistemas.
18 Sistemas difusos
Capítulo 3

Sistemas difusos jerárquicos vía


aprendizaje para identificación de
sistemas

En los sistemas difusos convencionales o de tipo estándar, el número de reglas aumenta de


forma exponencial con el crecimiento en el número de variables de entrada, esto es, suponga
que existen n variables de entrada y m funciones de membresía para cada variable, entonces
necesitaremos mn reglas para construir un controlador difuso completo y tan rápido como
n aumente su tamaño, la base de reglas difusas sobrecargará rápidamente la memoria de
cualquier sistema de computo y por supuesto, hará difícil la implementación del controlador
difuso. En general, la complejidad de un problema aumenta de forma exponencial debido al
número de las variables implicadas, este fenómeno llamado la “maldición de la dimensional-
idad”, no es único de los sistemas difusos y es la idea original que motivó el estudio de los
sistemas difusos jerárquicos (HFSs), Brown [3] y Zhou [37].
20 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

(c)

Figura 3.1: (a) y (b) Representación para el sistema lógico difuso jerárquico; (c) repre-
sentación para el sistema lógico difuso convencional de una sola capa.

3.1. El sistema difuso jerárquico


Los sistemas difusos jerárquicos consisten de un número de sistemas difusos de baja
dimensión distribuidos de forma jerárquica, los cuales, poseen la gran ventaja de que el
número total de reglas de su base de conocimiento aumentan de forma lineal con el número
de las variables de entrada implicadas, Zhou [37]. Esta arquitectura se representa en la figura
3.1(a) y (b) con 4 (n = 4) variables de entradas y 5 (m = 5) funciones de membresía, se
obtiene que cada sistema difuso de baja dimensión consiste de 52 (m2 ) reglas y por tanto el
número total de reglas es 3 × 52 = 75[(n − 1)m2 ], la cual representa una función lineal de las
n variables de entrada. En contraste con esto, podemos verificar que el número de reglas del
sistemas difuso convencional, figura 3.1(c), es de 54 = 625 reglas y por tanto, concluir que el
número total de reglas difusas se reduce considerablemente bajo el esquema de los sistemas
difusos jerárquicos.

Comentario 3.1 Los sistemas difusos jerárquicos consisten de un número de sistemas di-
3.2 Identificación de sistemas vía aprendizaje difuso jerárquico 21

fusos de baja dimensión conectados en un arreglo jerárquico, por tanto no existe restricción
alguna para aplicar el orden en las jerarquías, figura 3.1(a) y (b).

Para eliminar el problema concerniente al fenómeno de la “maldición de la dimension-


alidad” y consecuentemente los problemas de implementación, el presente trabajo propone
un nuevo enfoque para la determinación de las reglas correspondientes a cada unidad lógica
difusa (FLU1 ) de un sistema jerárquico difuso dado vía aprendizaje difuso jerárquico.

3.2. Identificación de sistemas vía aprendizaje difuso


jerárquico
En los últimos años, las redes neuronales y la lógica difusa han sido clasificadas como
aproximadores universales debido a que éstas pueden aproximar ciertas funciones no lin-
eales a cualquier exactitud prescrita. Resultados recientes muestran que el procedimiento de
fusión en este tipo de tecnologías parecen ser muy efectivos para la identificación de sistemas
no lineales, Brown (1994) [2], Chen (2001) [4] y Lin (1996) [16]. Aunque los métodos co-
mo el gradiente descendiente y el backpropagation generalmente son usados para ajustar los
parámetros de las funciones de membresía y los pesos de defuzzificación para redes neuronales
difusas, la convergencia lenta de aprendizaje y los mínimos locales son principalmente los
inconvenientes que presentan estos algoritmos, Lin (1995) [17]. Debido a esto, algunas mod-
ificaciones fueron derivadas en publicaciones recientes: En el 2001 Chen [5], sugiere una ley
de robustez en el algoritmo backpropagation para resistir los efectos del ruido y el no aceptar
errores derivados durante la aproximación. Por su parte, Brown (1994) [2], propone el uso de
funciones de membresía B-spline para minimizar una función objeto robusta demostrando
velocidad de convergencia en sus algoritmos y por último Wu (2000) [33] aplica redes neu-
ronales del tipo RBF para determinar la estructura y los parámetros de un sistema neuronal
difuso.
1
Fuzzy Logic Unit
22 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

Analizando la bibliografía anterior se observa que existen diversos métodos correspondi-


entes para la identificación de sistemas, los cuales pueden ser aplicados efectivamente para
resolver el problema de la identificación, sin embargo, desde el punto de vista del diseño
Wang (1999) en [29], señala que es muy dificil aplicar técnicas de aprendizaje a los sistemas
difusos jerárquicos si se usa el algoritmo backpropagation, por otra parte, Yu (2004) en [31],
demuestra que el uso de algoritmos de entrenamiento resultan ser extremadamente complejos
aún para el caso de una red neuronal difusa de una capa y consecuentemente para el uso de
sistemas difusos jerárquicos. Aunque usando técnicas como el backpropagation y el algoritmo
del gradiente descendiente podemos simplificar el entrenamiento para redes neuronales mul-
ticapas, ¿Será posible entrenar sistemas difusos jerárquicos por medio de técnicas similares?.
Hasta ahora, lo mejor de nuestro conocimiento para el entrenamiento de los sistemas difusos
jerárquicos es el usado algoritmo convencional del gradiente descendiente.

Debido al problema2 que enfrenta el diseño de los sistemas difusos convencionales con una
precisión establecida, el propósito fundamental de este capitulo, es el de introducir un método
tipo backpropagation para la identificación de sistema vía sistemas difusos jerárquicos. En
ciertos casos, el diseño de un sistema difuso también es limitado cuando no podemos decidir la
función de membresía de prioridad, por lo que generalmente, se recomienda el uso del dato
de entrada-salida para entrenar los parámetros de la función de membresía, por ejemplo
ANFIS [10] y el aprendizaje por el método del gradiente [28], sin embargo para evitar esta
limitación, en el presente trabajo se asume que ambas funciones de membresía, premisa y
consecuencia, son desconocidas.

El nuevo algoritmo que se presenta a continuación es tan sencillo que podemos entrenar
exactamente los parámetros de cada sub-bloque independientemente con diferentes veloci-
dades en el aprendizaje. Adicionalmente, un par de ejemplos se incluyen para ilustrar la
efectividad del algoritmo sugerido.

2
Problema causado por la “maldición de la dimensionalidad”.
3.2 Identificación de sistemas vía aprendizaje difuso jerárquico 23

3.2.1. Error backpropagation


Generalmente un modelo convencional difuso con una salida es representado como una
colección de reglas difusas en el siguiente formato (por ejemplo, el modelo difuso de Mamdani
[28])
Ri : Si x1 is Ai1 y · · · y xn is Ain entonces yb is B i (3.1)
en donde l (i = 1, 2, . . . , l) representa las reglas difusas del tipo si-entonces para desarrollar
un mapeo del vector lingüístico de entrada X = [x1 , · · · , xn ] ∈ <n a una salida lingüística
ŷ. Por otra parte, Ai1 , · · · , Ain y B i denotan conjuntos difusos y cada variable de entrada
xj (j = 1, 2, . . . , n) define lj conjuntos difusos. Para el caso de una conexión completa se
tiene que l = l1 × l2 × . . . ln .
Como anteriormente se ha comentado, la idea principal de construcción en los sistemas
difusos jerárquicos para evitar la maldición de la dimensionalidad, es el la de colocar las
variables de entrada del sistema en una colección de sistemas difusos de baja dimensión, los
cuales, constituyen los niveles jerárquicos del sistema, figura 3.2. Por lo tanto, para las n
variables de entrada x1 , x2 , . . . , xn con M1 reglas definidas en cada nivel, el sistema difuso
jerárquico es construido como sigue:

El primer nivel es un sistema difuso con n1 variables de entrada x1 , x2 , . . . , xn1 , el cual


es construido a través de las reglas

Ri : Si x1 is Ai1 y . . . y xn1 is Ain1 entonces yb is B1i

en donde 2 ≤ n1 < n y i = 1, 2, . . . , l1 .

El p − ésimo nivel (p > 1) es un sistema difuso con np variables de entrada y una sola
salida, por lo tanto, la base de reglas definidas para el sistema difuso de este nivel es
construido a través de

Ri : xp,1 es Aip,1 y . . . y xp,np1 es Aip,np1 y ŷp−1,1 es Dp−1,1


i i
y . . . y ŷp−1,np2 es Dp−1,np2
=⇒ ŷp es Bpi

en donde i = 1, . . . , lp , ybp−1,j es la j − ésima salida en el nivel p − 1, xp,j es la j − ésima


entrada en el nivel p, np1 + np2 = np, np1 ≥ 0 y np2 ≥ 0. Si np1 6= 0 el sistema
24 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

Figura 3.2: Sistema difuso jerárquico

jerárquico es llamado de arquitectura incremental y cuando np = np2 , este es llamado


de arquitectura agregada, Chung [6].

Por último, la construcción continua hasta p = o.

De acuerdo al diseño convencional de los sistemas difuso, existen varias estrategias para
representar la salida de estos, el presente trabajo considera el uso del mecanismo de inferencia
tipo producto, el uso del fuzzificador singlenton y del defuzzificador centro promedio por lo
que el mapeo no lineal
" #
P
l Q
n
wi µAij (xj )
i=1 j=1
yb = " #
P
l Q
n
µAij (xj )
i=1 j=1

representa la salida ŷ del sistema difuso definido a partir de la base de reglas difusas definidas
por (3.1), en donde µAij representa las funciones de membresía de los conjuntos difusos Aij y
wi es la moda de µB1i , es decir, µB1i = 1.
Adicionalmente, para el sistema difuso jerárquico de la figura 3.2, se tiene que la salida
3.2 Identificación de sistemas vía aprendizaje difuso jerárquico 25

definida para el primer nivel (p = 1) es descrita por


" #
P
l1 Q
n1
w1i µAij (xj )
i=1 j=1
yb1 = " # (3.2)
P
l1 Q
n1
µAij (xj )
i=1 j=1

en donde µAij representa las funciones de membresía de los conjuntos difusos Aij y wi es la
moda de µB1i , es decir, µB1i = 1
Similarmente, el p − ésimo nivel (p > 1) es dado por
lp
" np1 np2
#
X Y Y
wpi µAip,j (xp,j ) µDp,j
i (ŷp−1,j )

i=1 i=1 i=1


ŷp = " np1
lp np2
# (3.3)
X Y Y
µAip,j (xp,j ) µDp,j
i (ŷp−1,j )

i=1 i=1 i=1

en donde µAip,j y µDp,j


i son las funciones de membresía de los conjuntos difusos Aip,j y Dp,j
i

respectivamente y wpi es la media de µBpi , i.e., µBpi = 1.


A continuación se desarrolla un ejemplo para explicar de forma detallada como usar la
técnica sugerida “tipo-backpropagation” en los sistemas difusos jerárquicos.
Considere los tres bloques difusos F s1, F s2 y F s3 que conforman el sistema difuso
jerárquico definido en la figura (3.3). Observe que para cada subsistema, existen l reglas
difusas, n entradas y 1 salida. Al hacer uso del fuzzificador singlenton, de la implicación
de Mamdani y del defuzzificador centro promedio,
∙ ³ la salida ¸ de cada sistema difuso puede
xj −ci ´2
ser expresada como (3.2), en donde µAij = exp − σi j es la función de membresía del
j

conjunto difuso Aij , i


w̄ es el punto en el cual µBi = 1 y ŷ es la salida de cada sistema difuso.
Ahora bien, defínase
" µ ¶2 #
Y
n
xj − cij a
i
z (x) := exp − i
y ŷ = con
j=1
σj b

X
l X
l
i i
a := w z , b := zi
i=1 i=1
26 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

Planta

Fs1

Fs3
Fs2

Figura 3.3: Un sistema difuso jerárquico para identificación.

El objetivo de la de identificación es el de determinar los parámetros wi , cij y σ ij tal que la


salida ŷ del sistema difuso jerárquico converja a la salida de la planta y.
Al usar la técnica del gradiente descendiente para determinar los parámetros wi , cij y σ ij ,
el gradiente es determinado a través del uso de la regla de la cadena, por lo que se tiene que
¡ ¢
∂J ∂J ∂ ŷ ∂ ab (ŷ − y) i
i
= i
= (ŷ − y) i
= z
∂w ∂ ŷ ∂w ∂w b
y wi es actualizado por
wi (k + 1) = wi (k) + ∆wi
∂J
= wi (k) − η i
∂w
i
z
= wi (k) − η (ŷ − y) (3.4)
b
x
Para determinar los incrementos en cj y ∆cj , como ∂e
i i
∂x
= ex , entonces
∙ i ¸ " ¡ ¢#
∂J ∂J ∂ ŷ ∂z i w a i xj − cij
= = (ŷ − y) − 2 z 2 ¡ ¢2
∂cij ∂ ŷ ∂z i ∂cij b b σ ij
por lo que el vector cij es actualizado por
¡ ¢
(wi − ŷ) xj − cij
cij (k + 1) = cij (k) − 2η(ŷ − y)z i
¡ ¢2 .
b σ ij
3.2 Identificación de sistemas vía aprendizaje difuso jerárquico 27

Similarmente, como
¡ ¢ n " µ ¶2 # " ¡ ¢2 #
∂J ∂J ∂ ŷ ∂z i ∂ ab Y xj − cij xj − cij
= = (ŷ − y) exp − 2 ¡ ¢3
∂σ ij ∂ ŷ ∂z i ∂σ ij ∂z i j=1 σ ij σ ij

, σ ij es actualizado por
¡ ¢2
(wi − ŷ) xj − cij
σ ij (k + 1) = σ ij (k) − 2η(ŷ − y)z i
¡ ¢3 .
b σ ij
Si definimos el error de identificación como e = ŷ(k) − y(k). El método del gradiente descen-
diente puede escribirse en en términos del error
zi
wi (k + 1) = wi (k) − η e (3.5)
b ¡ ¢
i i i
(wi (k) − ŷ(k)) xj (k) − cij (k)
cj (k + 1) = cj (k) − 2ηz (k) ¡ ¢2 e
b(k) σ ij (k)
¡ ¢2
i i i
(wi (k) − ŷ(k)) xj (k) − cij (k)
σ j (k + 1) = σ j (k) − 2ηz (k) ¡ ¢3 e.
b(k) σ ij (k)
Las entradas y las salidas de cada subsistema están definidas como se muestra en la figura
(3.3), por lo que el índice de desempeño es modificado de tal forma que J = 1
2
(ŷ3 − y)2 .
Para el módulo F s3, el algoritmo de aprendizaje es el mismo descrito por la ecuación (3.5),
solamente que debemos agregar los subíndices correspondientes en cada una de las variable,
por ejemplo, wi (k +1) → w3i (k +1), cij (k +1) → ci3 (k +1), σ ij (k +1) → σi3 (k +1), x3,1 = ŷ1 (k),
x3,2 (k) = ŷ2 (k), e = ŷ3 (k) − y(k) = e3 y
l3
"n #
X Y3

w3i µAi3,j (x3,j )


i=1
ŷ3 = " ni=1 # . (3.6)
X Y
l3 3

µAi3,j (x3,j )
i=1 i=1

Para el subsistema F s2, si deseamos actualizar w2i , debemos calcular


∂J ∂J ∂ ŷ3 ∂ ŷ2
=
∂w2i ∂ ŷ3 ∂ ŷ2 ∂w2i
28 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

∂ ŷ3
de la figura (3.3), sabemos que ∂ ŷ2
corresponde a x3,2 (k), por lo que

∂J
= ŷ3 − y.
∂ ŷ3
∙ ¸ " #
∂ ŷ3 ∂ ŷ3 ∂z3i a3 w3i i ŷ2 − ci3,2
= i = 2 − z 2¡ ¢2 , (3.7)
∂ ŷ2 ∂z3 ∂ ŷ2 b3 b3 3 σ i3,2
a3 ȳi ŷ3 −ȳ3i
ya que b23
− b3
= b3
, y

∂J z2i ŷ3 − w3i i ŷ2 − ci3,2


= 2 z3 ¡ ¢2 e3 (k)
∂w2i b2 b3 σ i3,2

por lo que ȳ2j es actualizado por

z2i ŷ3 − w3i i ŷ2 − ci3,2


w2i (k + 1) = w2i (k) −η 2 z3 ¡ ¢2 e3 (k). (3.8)
b2 b3 σ i3,2

Comparando la ecuación (3.8) con (3.4), definimos

y3 − w3i i ŷ2 − ci3,2


e2 = 2 z3 ¡ ¢2 e3 (k)
b3 σ i3,2
∂ ŷ3 ∂ ŷ3
Usando la ecuación (3.7) e2 puede escribirse como e (k).
∂ ŷ2 3
Similarmente e1 = e (k),
∂ ŷ1 3
donde
∂ ŷ3 y3 − w3i i ŷ2 − ci3,1
=2 z3 ¡ ¢2 .
∂ ŷ1 b3 σ i3,1
Así con e1 (k) y e2 (k) podemos entrenar el subsistema F s1 y F s2 independientemente por el
algoritmo normal, Jang [10].

3.2.2. Algoritmo para identificación de sistemas no lineales


Nuestro propósito en esta subsección es el de presentar un algoritmo para el caso general
de la identificación de sistemas mostrado en la figura 3.4, por lo que el procedimiento de
entrenamiento es el siguiente:
3.2 Identificación de sistemas vía aprendizaje difuso jerárquico 29

p
q

Figura 3.4: Entrenamiento en el caso general para la identificación de sistemas.

Algoritmo 3.1 Algoritmo para la identificación de sistemas


Paso 1: De acuerdo con la estructura del sistema difuso jerárquico, calcule la salida de
cada bloque mediante el uso de la ecuación (3.3). Algunas salidas del sistema difuso jerárquico
deben ser entradas del siguiente nivel.
Paso 2: Calcule el error para cada bloque. Comenzando desde el último bloque, el error
de identificación es
eo (k) = ŷo (k) − y(k)

donde eo (k) es el error de identificación, ŷo (k) es la salida del sistema difuso jerárquico
completa y y(k) es la salida de la planta. Entonces propagando el error hacia atrás se forma
la estructura del sistema difuso jerárquico. De acuerdo con la figura (3.4), podemos calcular
el error para el bloque p (definido como ep ) formado a través del bloque q (definido como eq ).
Recordando la discusión anterior de la regla de la cadena se tiene
yq − wqi i ŷp − ciq,p
ep = 2 zq ¡ ¢2 eq . (3.9)
bq σ iq,p

Paso 3: Actualice los parámetros de la función gausiana ( funciones de membresía:


premisa y consecuencia) para cada bloque independientemente, por lo que el algoritmo tipo
backpropagation para p − ésimo bloque es
zpi
wpi (k + 1) = wpi (k) − η ep ,
bp
30 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

Bloque de control

Controlador
difuso Planta

HFS Σ

Bloque de identificación

Figura 3.5: Diagrama a bloques que representa el aprendizaje de tipo Off-Line.


¡ i ¢¡ i
¢
wp (k) − ŷp (k) x p,j (k) − cp,j (k)
cip,j (k + 1) = cjp,i (k) − 2ηzpi (k) ¡ i ¢2 ep ,
bp (k) σ p.j (k)
¡ i ¢¡ i
¢2
w p (k) − ŷ p (k) x p,j (k) − c p,j (k)
σ ip,j (k + 1) = σ ip,j (k) − 2ηzpi (k) ¡ i ¢3 ep ,
bp (k) σ p,j (k)
Ynp ∙ ³ ´¸ Y lp
i xp.j −cip,j 2
en donde zp = exp − σi
y bp = zpi .
p,j
j=1 j=1

Como se ha señalado, varias aplicaciones en el área del control automático y en el área


de la identificación de sistemas han sido desarrolladas. En efecto, el uso de sistemas difusos
jerárquicos para la identificación de sistemas es en general un método universal, el cual,
también pude ser aplicado para el aprendizaje de controladores difusos o de tipo convencional.

3.3. Aprendizaje de un controlador en sistemas difusos


Basados en los resultados de la sección anterior, es fácil observar que se pueden determinar
de manera similar al problema de identificación los parámetros wi , cij y σ ij tal que la salida
û del sistema difuso jerárquico converja a la salida de un controlador convencional u, figura
3.5. Por tanto, el propósito general de esta sección, es el de presentar el siguiente algoritmo
para el aprendizaje de tipo off-line.
3.3 Aprendizaje de un controlador en sistemas difusos 31

p
q

Figura 3.6: Entrenamiento para sistemas de control usando sistemas difusos jerárquicos.

Algoritmo 3.2 Aprendizaje de un controlador vía sistemas difusos jerárquicos


Paso 1: De acuerdo con la estructura del sistema difuso jerárquico, calcule la salida de
cada bloque mediante el uso de la ecuación (3.3). Algunas salidas del sistema difuso jerárquico
deben ser entradas del siguiente nivel.
Paso 2: Calcule el error para cada bloque. Comenzando desde el último bloque, el error
de control es
eo (k) = ûo (k) − u(k)

donde eo (k) es el error de control, ûo es la salida del controlador difuso jerárquico completo
y u(k) es la salida del controlador convencional. Entonces propagando el error hacia atrás
se forma la estructura del sistema difuso jerárquico. De acuerdo con la figura 3.6, podemos
calcular el error para el bloque p (definido como ep ) formado a través del bloque q (definido
como eq ). Recordando la discusión anterior de la regla de la cadena se tiene

uq − wqi i ûp − ciq,p


ep = 2 zq ¡ ¢2 eq . (3.10)
bq σ iq,p

Paso 3: Entrene la función gausiana ( función de membresía en la parte de la premisa


y consecuencia) para cada bloque independientemente, para el p − ésimo bloque, el algoritmo
tipo backpropagation es el siguiente
zpi
wpi (k + 1) = wpi (k) − η ep ,
bp
32 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

¡ i ¢¡ i
¢
wp (k) − ûp (k) x p,j (k) − cp,j (k)
cip,j (k + 1) = cjp,i (k) − 2ηzpi (k) ¡ ¢2 ep ,
bp (k) σ ip.j (k)
¡ i ¢¡ ¢2
wp (k) − ûp (k) xp,j (k) − cip,j (k)
σ ip,j (k + 1) = σ ip,j (k) − 2ηzpi (k) ¡ ¢3 ep ,
bp (k) σ ip,j (k)
np
Y ∙ ³ ´¸ lp
Y
xp.j −cip,j 2
en donde zpi = exp − σi
y bp = zpi .
p,j
j=1 j=1

Para validar el desempeño de los sistemas difusos jerárquicos en la identificación de


sistemas y la efectividad del método propuesto, a continuación se presenta la simulación
numérica con los siguientes ejemplos propuestos por Chung [6].

3.4. Simulaciones
El primer sistema, un ejemplo de cinco dimensiones, es usado para validar la importancia
del método difuso jerárquico y el método de análisis correspondiente a la subsección anterior.
Por otra parte, el segundo ejemplo, la predicción de una serie de tiempo tipo Mackey-Glass,
es empleado para ilustrar el buen comportamiento en el aprendizaje y demostrar la excelente
habilidad en la generalización del método tipo backpropagation.

3.4.1. Ejemplo de cinco dimensiones


La planta no lineal a identificar fue originalmente usada por Friedman para evaluar el
algoritmo de modelado MARS [7], definida por

y = 10 sin(πx1 x2 ) + 20(x3 − 0,5)2 + 10x4 + 5x5 . (3.11)

en donde el vector de entrada es

x(k) = [x1 , x2 , x3 , x4 , x5 ].
3.4 Simulaciones 33

Planta

Fs1

Fs3

Fs2

Figura 3.7: Estructura jerárquica difusa para identificar el sistema no lineal definido por (
3.11).

Para la identificación del sistema no lineal definido por (3.11), se utilizó el modelo de la
estructura jerárquica difusa definido en la figura 3.7. La identificación se realizó por com-
putadora con la ayuda de Matlab usando dos reglas difusas para cada bloque difuso jerárquico
l1 = l2 = l3 = 2 y definiendo el número total de entradas para cada bloque como n1 = 3,
n2 = 2 y n3 = 2. Observe que el número de entradas y de reglas difusas definidas en cada
bloque difuso pueden ser definidas arbitrariamente por ejemplo l1 = l2 = l3 = 3 y n1 = 2,
n2 = 2 y n3 = 3 , sin embargo, para mostrar la efectividad del algoritmo en la reducción de
las reglas difusas se utiliza el formato propuesto. La simulación utiliza 200 datos de entre-
namiento para el ejemplo, en donde la señal de entrada para el entrenamiento es aleatoria
en el rango de [0, 1].
Las figuras 3.8, 3.9, 3.10 y 3.11 muestran los resultados de la simulación numérica para
el sistema descrito por la ecuación (3.11) a través del uso de sistemas difusos jerárquicos y
el método convencional de identificación propuesto por Brown [2], Jang [10] y Lin [16]. En
las figuras 3.8 y 3.9, se presentan la salida de la planta y el modelo identificado a través del
uso de los sitemas jerárquicos difusos. Como se puede observar en la figura 3.9, este modelo
identificado representa una mejor aproximación de la planta no lineal con respecto a los
resultados mostrados por el método convencional difuso, figuras 3.10 y 3.11 respectivamente.
34 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

Sistema difuso jerárquico


30
Salida de la planta
Modelo identificado

25

20

15

10

0
0 20 40 60 80 100 120 140 160 180 200
Tiempo

Figura 3.8: Identificación para una sistema difuso jerárquico con 2+2+2=6 reglas difusas.

Sistema difuso jerárquico

S alida de la planta
Modelo identificado

25

20

15

10

5 10 15 20 25 30 35 40 45 50 55
Tiempo

Figura 3.9: Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de cinco
dimensiones cuando 0<t<55.
3.4 Simulaciones 35

Sistema difuso convencional


30
S alida de la planta
Modelo identificado

25

20

15

10

-5
0 20 40 60 80 100 120 140 160 180 200
Tiempo

Figura 3.10: Identificación para un sistema difuso convencional con 12 reglas difusas.

Sistema difuso convencional

S alida de la planta
Modelo identificado

25

20

15

10

-5
5 10 15 20 25 30 35 40 45 50 55
Tiempo

Figura 3.11: Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de cinco
dimensiones cuando 0<t<55.
36 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

Error cuadrático medio para el ejemplo de cinco dimensiones


60
S istema difuso jerárquico
S istema difuso convencional

50

40
E rror cuadrático medio

30

20

10

0
0 20 40 60 80 100 120 140 160 180 200
Tiempo

Figura 3.12: Comparación del desempeño entre los métodos convencional y jerárquico para
el ejemplo de cinco dimensiones.

Comparando el desempeño del algoritmo tipo-backprpagation propuesto (mse:0.5070) con-


tra el método convencional de la lógica difusa (mse: 4.4919), figura 3.12, es posible observar
que podemos modelar sistemas no lineales con un número menor de reglas difusas y conse-
cuentemente, con una mayor velocidad de convergencia en el algoritmo propuesto.

3.4.2. Predicción de una serie de tiempo tipo Mackey-Glass

Sea {x(t), t = 1, 2, 3, . . . , } una serie de tiempo, el problema de predicción en una serie de


tiempo puede ser formulada como la determinación del mapeo de

[x(t − (m − 1)∆t), . . . , x(t − ∆t), x(t)] ∈ Rm → x(t + ls ) ∈ R.

Para verificar el mapeo, la generalización y la habilidad de aprendizaje, una estructura


jerárquica difusa es propuesta para predecir la serie de tiempo caótica de Mackey-Glass,
figura 3.13 [20].
3.4 Simulaciones 37

Planta

Fs1

Fs3
Fs2

Figura 3.13: Estructura jerárquica difusa para identificar la serie de tiempo Mackey-Glass.

La serie de Mackey-Glass es generada por la ecuación diferencial:

0,2x(t − τ )
ẋ(t) = .
1 + x10 (t − τ )

De acuerdo con ejemplo propuesto por Chung [6], en nuestra simulación se establece que
τ = 30, m = 6, ∆t = 6, ls = 6 y un total de 1200 datos se recolectaron con el siguiente
formato
[x(t − 30), x(t − 24), x(t − 18), x(t − 12), x(t − 6), x(t); x(t + 6)] (3.12)

en donde t = 130 − 1329. La ecuación (3.12), corresponde al problema de un mapeo de 6


entradas- 1 salida.
Las figuras 3.14, 3.15, 3.16 y 3.17 muestran los resultados de la simulación para el sistema
descrito por la ecuación (3.12) correspondiente al problema de un mapeo de 6 entradas-1
salida.a través del uso de los sistemas difusos jerárquicos y el método convencional de iden-
tificación propuesto por Brown [2], Jang [10] y Lin [16]. Las figuras 3.14 y 3.15, presentan
la señal de salida para la planta y el modelo identificado a través del uso de los sistemas
jerárquicos difusos. Como se puede observar en la figura 3.15, este modelo identificado repre-
senta una mejor aproximación del mapeo de 6 entradas-1 salida con respecto a los resultados
mostrados por el método convencional difuso, figuras 3.10 y 3.11 respectivamente.
38 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

Sistema difuso jerárquico


1.4
S alida de la planta
Modelo identificado

1.2

0.8

0.6

0.4

0.2

0
0 200 400 600 800 1000 1200
Tiempo

Figura 3.14: Identificación para un sistema difuso jerárquico con 2+2+2=6 reglas difusas.

Sistema difuso jerárquico


1.3 S alida de la planta
Modelo identificado

1.2

1.1

0.9

0.8

450 460 470 480 490 500 510 520 530 540 550
Tiempo

Figura 3.15: Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de predicción
en una serie de tiempo tipo Mackey-Glass cuando 0<t<55.
3.4 Simulaciones 39

Sistema difuso convencional


1.5
Salida de la planta
Modelo identificado

0.5

0
200 400 600 800 1000 1200
Tiempo

Figura 3.16: Identificación para un sistema difuso convencional con 12 reglas difusas.

Sistema difuso convencional

S alida de la planta
Modelo identificado
1.3

1.25

1.2

1.15

1.1

1.05

0.95

0.9

0.85

0.8

580 590 600 610 620 630 640 650 660 670 680
Tiempo

Figura 3.17: Salida de la planta y(x) y el modelo identificado ŷ(x) para el ejemplo de predicción
en una serie de tiempo tipo Mackey-Glass cuando 0<t<55.
40 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas

Error medio cuadrático para la predicción de una serie de tiempo tipo Mackey-Glass
0.025
S istema difuso jerárquico
S istema difuso convencional

0.02
E rror medio cuadrático

0.015

0.01

0.005

0
0 200 400 600 800 1000 1200
Tiempo

Figura 3.18: Comparación del desempeño entre los métodos convencional y jerárquico para
la predicción de una serie de tiempo tipo Mackey-Glass .

Comparando nuevamente el desempeño del algoritmo tipo-backprpagation propuesto (6


reglas difusas, mse: 0.0019) con el método convencional difusa (12 reglas difusas, mse: 0.0043),
figura 3.18, es fácil observar que el modelar sistemas no lineales (serie de Mackey-Glass) me-
diante el nuevo enfoque jerárquico, evita que la base de reglas difusas sobrecargé rápidamente
la memoria de cualquier sistema de computo.

Una vez que se ha verificado la correspondencia entre el mapeo, la generalización y la


habilidad de aprendizaje entre los sistemas difusos convencionales y los sistemas difusos
jerárquicos, se está en condiciones de confirmar que el enfoque difuso jerárquico permite
modelar sistemas con una gran reducción significativa en el número de reglas difusas y por
supuesto con mayor velocidad de convergencia y cálculos en computo con respecto a los
ofrecidos por los métodos convencionales.
3.5 Conclusiones del capítulo 41

3.5. Conclusiones del capítulo


Es fácil observar que existen diversos métodos para la identificación de sistemas, los
cuales pueden ser aplicados efectivamente para resolver el problema de la identificación, sin
embargo, desde el punto de vista del diseño difuso, una de las preocupaciones importantes
en los sistemas de la lógica difusa, es el cómo reducir el número total de reglas implicadas y
el de sus correspondientes requerimientos en cómputo.
Aunque los métodos como el gradiente descendiente y el backpropagation generalmente
son usados para la identificación de los sistemas, la convergencia lenta de aprendizaje y
los mínimos locales son principalmente los inconvenientes que presentan estos algoritmos.
Debido a esto, los resultados presentados en este capítulo muestran que usando la técnica
tipo-backpropagation y el algoritmo del gradiente descendiente podemos simplificar el entre-
namiento para los sistemas difusos jerárquicos, además de reducir el número total de reglas
implicadas y el de sus correspondientes requerimientos en cómputo. Adicionalmente, el par de
ejemplos incluidos en este capítulo sirven para ilustrar la efectividad del algoritmo sugerido.
En el siguiente capítulo, la idea general de los sistemas difusos jerárquicos descrita en
este capítulo será usada para diseñar un sistema de control difuso jerárquico.
42 Sistemas difusos jerárquicos vía aprendizaje para identificación de sistemas
Capítulo 4

Sistemas difusos jerárquicos vía


mapeo de variables para control difuso

La tendencia actual para el desarrollo en sistemas de control es principalmente en los


sistemas no lineales. Sin embargo, si es posible aproximarlos mediante modelos lineales,
podemos aprovechar uno o más métodos de diseño bien desarrollados, Ogata [21]. En un
sentido práctico, las especificaciones de desempeño para un sistema particular sugieren que
método usar. En el caso de los sistema de control difuso, una de las preocupaciones impor-
tantes es el cómo evitar el fenómeno relacionado a la “maldición de la dimensionalidad”,
Waratt [32]. Para eliminar el problema concerniente a este fenómeno y consecuentemente los
problemas de implementación, el presente trabajo propone un enfoque nuevo para la deter-
minación de las reglas correspondientes a cada unidad lógica difusa (FLU1 ) de un sistema
jerárquico difuso debido a la construcción de este a partir del controlador difuso convencional,
figura 4.1.
El uso de este enfoque establece que las salidas de la capa previa y las entradas de las
capas siguientes sean definidas como variables de mapeo intermedio. Mientras tanto, las
salidas de la primera capa de unidades lógicas difusas (FLUs) y las entradas de las otras
FLUs sean simplemente definidas a través del mapeo de las variables intermedias.
1
Unidad lógica difusa definida previamente en el capitulo 3
44 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

Controlador
difuso Planta

Controlador difuso jerárquico

M1

Controlador
M3
difuso

M2

Figura 4.1: Arquitectura de un controlador difuso a) Sistema de control b) Control difuso


convencional y c) Control difuso jerárquico.

Por lo tanto, el objetivo principal de este capítulo es el de presentar una solución en


esquemas jerárquicos para la reconstrucción del controlador vía mapeo de variables con el
fin de evitar la maldición de la dimensionalidad y consecuentemente disminuir las dificultades
de diseño e implementación de los sistemas difusos.

4.1. El sistema de estructura jerárquica


Uno de los propósitos fundamentales de utilizar sistemas difusos jerárquicos (HFS), es el
de minimizar el tamaño de una base de reglas difusas mediante la eliminación de la “maldición
de la dimensionalidad”, sin embargo, a pesar de la eficiente reducción de reglas, el sistema
difuso jerárquico se torna más complejo para su diseño e implementación en los diseños de
control. Más específicamente, esta limitación se debe a que la mayoría de las unidades de la
lógica difusa (FLUs) que constituyen un (HFS), se usan como variables de entrada de las
siguiente capa jerárquica, líneas punteadas en la figura 4.2.
Debido a esto, las reglas implicadas en las capas medias de la estructura jerárquica care-
4.1 El sistema de estructura jerárquica 45

Figura 4.2: Sistema difuso jerárquico.

C.V ( Variables de consecuencia )

A.V ( Variables del antecedente escogidas


de las variables de entrada de la primera capa )

Figura 4.3: Sistema de lógica difusa de estructura jerárquica.

cen de significado físico y llegan a ser tan prominentes como el gran crecimiento desmesurado
de capas en un (HFS), Brown [3] y Wang [29]. Para tratar este problema y el de su imple-
mentación, Joo (1999) [12] define que el diseño de los sistema difuso jerárquicos se debe
relacionar como un sistema de lógica difusa de estructura jerárquica (S-HFS2 ) tal y como se
muestra en la figura 4.3.
En la primera capa del S-HFS, todas las variables de entrada pueden ser usadas como
variables lingüísticas de antecedentes, siempre y cuando las variables del sistema sean uti-
2
Structure-hierarchical fuzzy system
46 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

lizadas normalmente como variables de entrada en esta capa. En la segunda capa, las salidas
de la primer capa no deben ser utilizadas como variables lingüísticas de antecedentes ya que
estas tienen poco significado físico. En vez de esto, éstas son usadas en las partes entonces
de las reglas difusas de esta capa, conclusiones. Las variables lingüísticas de antecedentes de
la capa siguiente, por ejemplo, pueden ser seleccionadas de los representantes elegidos de las
variables de entrada de la capa anterior. Consecuentemente, sólo las variables con significado
físico se utilizan en los antecedentes de las reglas difusas y las reglas difusas que resultan
llegan a ser fáciles de diseñar. Finalmente, el uso de este esquema facilita el diseño de las
reglas difusas implicadas en las capas medias de la estructura jerárquica sin la necesidad de
reajustar o rediseñar las reglas correspondientes a cada unidad lógica difusa (FLU).

4.2. El sistema difuso limpio-jerárquico L-HFS


Como se mencionó al inicio de este capítulo, el eliminar el excedente de reglas difusas
en los sistemas difusos convencionales, consiste en la reconstrucción del controlador difuso
convencional en un controlador difuso jerárquico. En esta sección, el nuevo método basado en
el mapeo de variables se designa como un sistema difuso limpio-jerárquico, el cual, es exhibido
a fin de obtener las bases de reglas difusas correspondientes al sistema difuso jerárquico.
A continuación se desarrolla un ejemplo para explicar de forma detallada como usar la
técnica sugerida L-HFS y después, en la siguiente sección, aplicaremos la técnica a un sistema
en particular3 a fin de obtener un sistema difuso jerárquico para el sistema.
Considere el sistema descrito en la figura 4.4 y la base de reglas difusas descrita en la
figura 4.5. De acuerdo con el sistema y la base de reglas difusas, se puede observar que
las tres variables de entrada son θ, θ̇ y x. Por otra parte, F1 y F2 , se definen como las
unidades de lógica difusa (FLUs) de la primera y segunda capa respectivamente. Las salidas
lingüísticas difusas definidas en la figura 4.5, se obtienen mediante el acceso aleatorio4 , las
cuales son usadas para generar una base en el mapeo de la base de reglas difusas. Como
3
Sistema riel-esfera
4
Método usado por Lee en [19].
4.2 El sistema difuso limpio-jerárquico L-HFS 47

F1

F2

Figura 4.4: Diagrama a bloques de un sistema difuso jerárquico (HFS).

ejemplo, definamos cada variable de entrada con tres términos lingüísticos : N es negativo,
C es cero y P es positivo. De esta manera, podemos obtener 27 (3×3×3=27) reglas difusas.
La reglas difusas de la figura 4.5 son las siguientes:

si θ es P , y θ̇ es P y x es P , entonces u es P ,
si θ es P , y θ̇ es C y x es P , entonces u es N,
.. .
.
si θ es N, y θ̇ es N y x es N, entonces u es N.

Primero,
³ ´de acuerdo a la figura 4.4, las variables de entrada definidas para el módulo F1
son θ, θ̇ . De acuerdo a la figura 4.5, uno fija los valores θ y θ̇ para escoger cada columna
vertical y comenzar el proceso de reducción como lo muestra la figura 4.6.

Intuitivamente, existen cinco tipos diferentes de renglones, por tanto, solamente necesita-
mos de cinco variables de mapeo para la salida intermedia uθ . Definiendo las cinco variables
de mapeo como Av , Bv , Cv , Dv y Ev , respectivamente (la figura 4.7 denota la relación de es-
tas variables). A continuación, seleccionemos el primer renglón de la figura 4.7 para explicar
que θ es P y que θ̇ es también P y a su vez, este es mapeado a la variable A. Obviamente,
de la figura 4.7, el FLU de F1 mostrado en la figura 4.8 puede ser construido a través de las
48 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

4
3

Figura 4.5: Reglas mediante el acceso aleatorio.

4 3

Figura 4.6: El proceso de reducción.


4.2 El sistema difuso limpio-jerárquico L-HFS 49

P C P Av
N N P
C P C Bv
N N P
P P C Dv Cv
N N N

N N N Ev
C P C
N N N

Figura 4.7: La relación de los renglones y las variables de mapeo.

reglas si-entonces como sigue:

si θ es P y θ̇ es P entonces u0 es Av ,
si θ es P y θ̇ es C entonces u0 es Bv ,
.. .
.
si θ es N y θ̇ es N entonces u0 es Ev .

De acuerdo con la figura 4.7, la relación que existen entre u0 y x es equivalente a la relación
entre las variables de mapeo (Av , Bv , Cv , Dv y Ev ) y a x. Por tanto, la tabla de la figura
4.9 puede ser construida como sigue:

si u0 es Av y x es P entonces u es P ,
si u0 es Av y x es C entonces u es Z,
.. .
.
si u0 es Ev y x es N entonces u es N.

Las reglas de la tabla de la figura 4.8 y 4.9 son lo que deseábamos para F1 y F2 respectiva-
mente.
50 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

Figura 4.8: Reglas para F1 .

Comentario 4.1 Para comprobar que se puede conseguir el mismo modelo de entrada-salida
antes y después de aplicar el método L-HFS, supóngase que tenemos un sistema con tres
variables de entrada y una base de reglas difusas definidas por la tabla de la figura 4.5.
Mediante el método convencional de la lógica difusa de una sola capa, la salida de u puede
ser expresada como sigue:

si θ es P y θ̇ es P y x es P entonces u es P.

Sin embargo, usando método L-HFS, podemos conseguir la misma salida u mediante el uso
de la tablas de las figuras 4.8, 4.9 y 4.4 respectivamente. Por lo que la descripción es la
siguiente:

si θ es P y θ̇ es P entonces u0 es Av .
si u0 es Av y x es P entonces u es P ,

De esta descripción , es obvio que podemos conseguir al mismo modelo de la entrada-


salida antes y después la descomposición L-HFS. Por otra parte, para un sistema de tres
variables de entrada, en el sistema convencional de la lógica difusa de una sola capa, las
reglas totales son 27 (3 × 3 × 3). Sin embargo, usando método de L-HFS, las reglas totales
4.2 El sistema difuso limpio-jerárquico L-HFS 51

Figura 4.9: Reglas para F2 .

son únicamente 24. Claramente, se ve de las tablas de la figura 4.8, 4.9 y 4.4. Eso significa
que hay 9 reglas para conseguir la salida de u0 y 15 reglas para conseguir la salida de u.
En cuanto a un sistema de n variables de entrada, el mismo modelo de la entrada-salida se
puede obtener antes y después la descomposición L-HFS y el número de reglas totales será
reducido considerablemente.

4.2.1. Algoritmo para la construcción del sistema difuso límpido-


jerárquico
Nuestro propósito en esta subsección es el presentar un algoritmo para el caso general en
la construcción de sistemas difusos jerárquicos, por lo que el procedimiento de construcción
es el siguiente:

Algoritmo 4.1 Construcción de sistemas L-HFS vía mapeo de variables.


Paso 1: Determine la forma del HFS y etiquete los FLU de 1i a ni de la i-ésima capa
como lo muestra la figura 4.10.
Paso 2: De la figura 4.10, fije las variable de entrada x1 , x2 y use el proceso de reduc-
ción para obtener el mapeo de las variables de salida FLU (11 ). Use de manera similar el
procedimiento para ejecutar el mapeo de las variables de salida para obtener 21 ,31 ,. . .,n1 .
52 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

1i

12 22 n2

11 21 31 41 n1

Figura 4.10: Diagrama de un HFS.

Paso 3: De la figura 4.10, fije las variables de entrada x1 ,x2 ,x3 ,x4 y utilice el proceso
de reducción para obtener el mapeo de las variables de salida FLU (12 ). De la misma man-
era utilice el procedimiento para ejecutar el mapeo de las variables de salida para obtener
22 ,32 ,. . .,n2 .
Paso 4: Repita el procedimiento del paso anterior hasta agotar todas las combinaciones
y hasta que la segunda capa se alcance.
Paso 5: En la capa final, podemos tabular las reglas finales FLU de las salidas lingüísticas
relacionadas a las variables de mapeo de la capa anterior.
Paso 6: Si al aplicar el proceso de mapeo de reducción para la i-ésima capa FLU (1i ), no
se observa reducción alguna para el mapeo de las variables de salida, redefiniremos el módulo
o los módulos correspondiente mediante el uso del operador mínimo5 , aplicado a cada una de
las premisas de las reglas difusas del o de los módulos correspondientes, de tal manera que
esta operación redefina la nueva consecuencia de la regla difusa correspondiente.
Paso 7: Por último las nuevas reglas difusas se comparan mediante el uso de un índice
de aproximación, el cual, de manera simple nos lleva a un proceso de reducción sencillo para
los módulos correspondientes.

A continuación se define el proceso de reducción del índice φ.


5
Vea [14] y [15] para más información acerca del operador.
4.2 El sistema difuso limpio-jerárquico L-HFS 53

1 µ A(x)

0.5

Figura 4.11: Un número triangular difuso en donde a1 , a2 y a3 describen respectivamente la


tripleta (a1 , a2 , a3 ).

Definición 4.1 Sean las reglas mostradas en las ecuaciones 4.1 y 4.2, la i-ésima y j-ésima
regla difusa correspondientes a una base de reglas difusa de tipo MISO.

Ri : Si u1 es Aj1 y u2 es Ak2 y ... y un es Aln , entonces yi es Bir (4.1)

Rj : Si u1 es Aj1 y u2 es Ak2 y ... y un es Aln , entonces yj es Bjs (4.2)

Se dice que Bjs = Bir si Z Z


i j
µR
α (x)dx = µR
β (x)dx (4.3)

y además existe un índice φ ∈ R, tal que

X
3
|αi − β i | < φ (4.4)
i=1

i j
en donde 4.3 denota el área bajo la curva de las funciones de membresía µR R
α (x) y µβ (x).
Note que para el índice de la ecuación (4.4), αi y β i representan los valores
n correspondiente o
i
a las tripleta definidas por las funciones de membresía µR α = mı́n µ j , µAk , ..., µAl
A1 y
n o 2 n
j
µR
β = mı́n µAj , µAk2 , ..., µAln respectivamente, figura 4.11.
1

A continuación para validar el desempeño de los sistemas difusos jerárquicos en los sistema
de control difuso se desarrolla un ejemplo para mostrar la efectividad del método en el sistema
riel-esfera propuesto por Ortiz [22].
54 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

Figura 4.12: Sistema riel-esfera.

4.3. Aplicación del L-HFS al sistema riel-esfera


El objetivo central de esta sección es el de presentar la construcción de un controlador
difuso jerárquico mediante el uso de la técnica L-HFS. En esta sección, consideraremos el
sistema no lineal riel-esfera como ejemplo de un sistema difuso convencional y posteriormente
aplicaremos la técnica propuesta al sistema en particular a fin de obtener un sistema difuso
jerárquico para el sistema. A continuación presentamos los aspectos básicos del sistema riel-
esfera para esta aplicación en particular.

4.3.1. El sistema riel-esfera

El sistema riel-esfera es el que aparece en la figura 4.12. El objetivo de este sistema es el


de controlar la posición de la esfera con el cambio en la posición del riel con respecto al eje
horizontal, en donde r define la distancia de la esfera al origen, ṙ la velocidad de la esfera, θ
el ángulo de la posición del riel y θ̇ la velocidad angular del riel.
Por otra parte, el conjunto de reglas difusas descritas el espacio de estado cuatro-dimensional
x = (r, ṙ, θ, θ̇) del sistema riel-esfera, figura 4.14, son definidas intencionalmente para propósi-
tos específicos de esta aplicación por lo tanto el dominio de entrada de interés para esta
aplicación esta definido por funciones triangulares de membresía, esto es,
4.3 Aplicación del L-HFS al sistema riel-esfera 55

F1

F3

F2

Figura 4.13: Estructura del HFS para el sistema riel-esfera.



⎪ 0 si x ≤ 0


⎨ x si 0 ≤ x ≤ 1
µP (x) = (x, 0, 1, 2) = ,

⎪ 2 − x si 1 ≤ x ≤ 2



0 si x ≥ 2


⎪ 0 si x ≤ −2


⎨ x + 2 si − 2 ≤ x ≤ −1
µN (x) = (x, −2, −1, 0) = ,

⎪ −x si − 1 ≤ x ≤ 0



0 si x ≥ 0
y


⎪ 0 si x ≤ −1


⎨ x + 1 si − 1 ≤ x ≤ 0
µC (x) = (x, −1, 0, 1) =

⎪ 1 − x si 0 ≤ x ≤ 1



0 si x ≥ 1
como se muestra en la figura 4.15.

4.3.2. Implementación del algoritmo L-HFS


Como anteriormente se comento, a continuación se presenta el uso del algoritmo L-HFS,
el cual describe paso a paso la construcción del sistema L-HFS correspondiente al control de
posición del sistema riel-esfera.
56 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

Figura 4.14: Las reglas del ejemplo.

Paso 1: La estructura para el diseño del HFS del sistema riel-esfera se muestra en la
figura 4.13 y la figura 4.14 muestra la tabla correspondiente a la base de reglas del controlador
difuso para un sistema convencional de lógica difusa de una sola capa, construido a través
de las siguientes reglas difusas del tipo si-entonces

si r es N y ṙ es C y θ es N y θ̇ es C entonces u es P ,
si r es N y ṙ es NC y θ es N y θ̇ es C entonces u es P ,
si r es N y ṙ es N C y θ es N y θ̇ es C entonces u es P G, (4.5)
..
.
si r es P y ṙ es NC y θ es P y θ̇ es NC entonces u es N.

en donde N es negativo, P es positivo, C es cero, NC es diferente de cero, P G es positivo


grande y NG es negativo grande, figura 4.15.
Paso 2: De acuerdo con la tabla de la figura 4.14 fije r,ṙ y use el método de mapeo
L-HFS para obtener las variables de mapeo RA , RB , RC y RD respectivamente. Construya
las reglas para el módulo F1 como muestra la figura 4.16.
4.3 Aplicación del L-HFS al sistema riel-esfera 57

(a) Funciones de entrada

1
N C P
0.8

membresía
0.6

0.4

0.2

0
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
x
(b) Funciones de salida

1
NG N P PG
0.8
membresía

0.6

0.4

0.2

0
-3 -2 -1 0 1 2 3
x

Figura 4.15: Funciones de membresía para las variables de entrada y salida.

Las base de reglas difusas del tipo si-entonces para el módulo Fr son

si r es N y ṙ es C entonces ur es RA (4.6)
si r es N y ṙ es NC entonces ur es RB
si r es P y ṙ es C entonces ur es RC
si r es P y ṙ es NC entonces ur es RD .

Paso 3: De manera similar fije θ y θ̇, use nuevamente el método de mapeo L-HFS para
obtener el mapeo de variables RE , RF , RG y RH . Construya las reglas para el módulo F2
como muestra la figura 4.16.
Las base de reglas difusas del tipo Si-entonces para el módulo Fθ son

si θ es N y θ̇ es C entonces ur es RE (4.7)
si θ es N y θ̇ es NC entonces ur es RF
si θ es P y θ̇ es C entonces ur es RG
si θ es P y θ̇ es NC entonces ur es RH .
58 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

Reglas para F1 o Fr

Reglas para F3 o Fu

Reglas para F2 o Fθ

Número de Reglas = F1 +F2 +F3 =24

Figura 4.16: Unidades F1 ,F2 y F3 y número de reglas.

Hemos terminado el proceso.


Paso 4 y 5: Finalmente para la segunda capa Fu , se usa el método propuesto de mapeo
para obtener la salida final u, como muestra la figura 4.16, en donde la base de reglas difusas
del tipo si-entonces para el módulo Fu es descrita por

si ur es RA y uθ es RE entonces u es P
..
.
si ur es RB y uθ es RH entonces u es N (4.8)
..
.
si ur es RD y uθ es RH entonces u es N.

Obsérvese en este punto que continuar con el proceso resultaría inútil, dado que el número
de reglas se ha incrementado considerablemente y supera en número a las definidas previa-
mente en el ejemplo, véase la figura 4.16.

Comentario 4.2 De acuerdo al algoritmo para la construcción de un sistemas L-HFS vía


mapeo de variables los pasos del 1 al 5 se aplican a bases de reglas difusa con estructura
similar a la descrita por la figura 4.5, sin embargo, los pasos 5 y 6 se aplican a bases con
estructuras similares a la descrita por la figura 4.14
4.3 Aplicación del L-HFS al sistema riel-esfera 59

De acuerdo al comentario anterior, al algoritmo y el uso de este al ejemplo, a contin-


uación se define el uso del operador “mínimo6 ” para obtener las nuevas variables de salida
correspondiente a los módulos Fr y Fθ . Por otra parte, con ayuda del índice de aproximación
φ, estas nuevas reglas de salida permiten de manera simple realizar el proceso de reducción
para el ó los módulos correspondientes.
Paso 5: Para determinar las nuevas variables de salida, considere la primer regla de la
base descrita por (4.6),

si r es N y ṙ es C entonces ur es RA

la cual representa la siguiente operación difusa

µ(r es N) AND µ(ṙ es C) = (µr (x)) ∧ (µṙ (x)) . (4.9)

Seleccionado el operador mínimo para la operación difusa descrita en (4.9), se obtiene que

(µr (x)) ∧ (µṙ (x)) = mı́n(µN (x), µC (x)). (4.10)

Por último, defínase µRA como la nueva variable de salida a partir de (4.10), es decir,

µRA = (µr (x)) ∧ (µṙ (x)) = mı́n(µN (x), µC (x))

explícitamente


⎪ 0 si x ≤ −1


⎨ x + 1 si − 1 ≤ x ≤ −0,5
µRA = mı́n(µN (x), µC (x)) =

⎪ −x si − 0,5 ≤ x ≤ 0



0 si x ≥ 0

en donde µr (x) = µN (x) y µṙ (x) = µC (x), figura (4.17).


A continuación se describen las nuevas variables de salida correspondientes a cada uno
de los módulos descritos en el ejemplo.
6
Vea [14] y [15] para más información acerca del operador.
60 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

Figura 4.17: Funciones de membresía tipo triangular para µr (x) y µṙ (x) y función de mem-
bresía resultante para µr∧ṙ (x) = mı́n(µr (x), µṙ (x)).

Módulo F1
Primer regla:
si r es N y ṙ es C entonces ur es RA (4.11)

De acuerdo con la discusión anterior, se tiene que para la primer regla




⎪ 0 si l ≤ −1


⎨ l + 1 si − 1 ≤ l ≤ −0,5
µr∧ṙ (l) = µRA (l, −1, −0,5, 0) = con l = (r, ṙ). (4.12)

⎪ −l si − 0,5 ≤ l ≤ 0



0 si l ≥ 0

Segunda regla:
si r es N y ṙ es NC entonces ur es RB (4.13)

entonces (4.13) se rescribe como:

si r es N y ṙ es N entonces ur es RB (4.14)

o
si r es N y ṙ es P entonces ur es RB (4.15)
4.3 Aplicación del L-HFS al sistema riel-esfera 61

Por lo tanto, para la regla difusa (4.14) se determina que la variable de salida es


⎪ 0 si l ≤ −2


⎨ l + 2 si − 2 ≤ l ≤ −1
µr∧ṙ (l) = µRB (l) = (l, −2, −1, 0) = con l = (r, ṙ) (4.16)

⎪ −l si − 1 ≤ l ≤ 0



0 si l ≥ 0

y de manera similar, para la regla difusa (4.15), se tiene que

µr∧ṙ (l) = 0

Tercer regla:
si r es P y ṙ es C entonces ur es RC (4.17)

se concluye que ⎧

⎪ 0 si l ≤ 0


⎨ l si 0 ≤ l ≤ 0,5
r∧ṙ (l) = µRC (l, 0, 0,5, 1) = (4.18)

⎪ 1 − l si 0,5 ≤ l ≤ 1



0 si l ≥ 1
Cuarta regla:
si r es P y ṙ es NC entonces ur es RD (4.19)

La cuarta regla (4.19) se redefine como

si r es P y ṙ es P entonces ur es RD (4.20)

ó
si r es P y ṙ es N entonces ur es RD (4.21)

por lo tanto, (4.22) define la variable de salida para (4.20)




⎪ 0 si l ≤ 0


⎨ l si 0 ≤ l ≤ 1
µr∧ṙ (l) = µRD (l) = (l, 0, 1, 2) = con l = (r, ṙ) (4.22)

⎪ 2 − l si 1 ≤ l ≤ 2



0 si l ≥ 2
62 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

y a su vez (4.23) define la nueva variable de salida para (4.21).

µr∧ṙ (x) = 0 (4.23)

Un proceso similar se efectúa para determinar las nuevas variables de salida correspon-
dientes al modulo F2 descrito en el ejemplo.
Paso 7 (El índice de aproximación φ):. Obsérvese que las funciones de membresía
definidas por (4.12) y (4.18), para el módulo Fr , satisfacen la condición (4.3). Es fácil observar
que (4.24) representa la ecuación (4.4) en términos de las tripletas correspondientes para
(4.12) y (4.18).

3 ¯
X ¯
¯ ¯
¯µ(RA )i − µ(Rc )i ¯ = |−1 − 0| + |−0,5 − 0,5| + |1 − 1| (4.24)
i=1
= 3<φ

Similarmente, para el módulo Fθ se tiene que (4.25) representa la ecuación (4.4) en términos
de las tripletas correspondientes

3 ¯
X ¯
¯ ¯
¯ (RE )i
µ − µ(RG )i ¯ = |−1 − 0| + |−0,5 − 0,5| + |1 − 1| (4.25)
i=1
= 3 < φ.

Ahora bien, definiendo φ = 4 como el índice de aproximación entre reglas difusas y re-
definiendo las variables de mapeo, figura 4.18, el conjunto de reglas difusas para el módulo
Fr , ecuación (4.6), se rescribe como

si r es N y ṙ es C entonces ur es RA (4.26)
si r es N y ṙ es NC entonces ur es RB
si r es P y ṙ es C entonces ur es RA
si r es P y ṙ es NC entonces ur es RC
4.3 Aplicación del L-HFS al sistema riel-esfera 63

Figura 4.18: Reestructura para la base de reglas de una sola capa

de igual modo para Fθ , ecuación (4.7), se tiene que

si θ es N y θ̇ es C entonces ur es RD (4.27)
si θ es N y θ̇ es NC entonces ur es RE
si θ es P y θ̇ es C entonces ur es RD
si θ es P y θ̇ es NC entonces ur es RF

y por último el módulo Fu descrito por (4.8) se redefine por (4.28), figura 4.19.

Si ur es RA y uθ es RD entonces u es P ∨ P G,
..
.
Si ur es RB y uθ es RE entonces u es P, (4.28)
..
.
Si ur es RC y uθ es RF entonces u es N.

La figura 4.19 muestra las nuevas reglas difusas para los módulos Fr , Fθ y Fu respectivamente.
Por otra parte, la figura 4.20 muestra las funciones de membresía para las variables de salida
64 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

Reglas para F1 o Fr

Reglas para F3 o Fu

Reglas para F2 o Fθ

Número de Reglas = F1 +F2 +F3


Número de Reglas = 3 +3 +9 =15

Figura 4.19: Nuevas reglas para Fr , Fθ y Fu .

(a ) F u n c io n e s d e m e m b re s ia d e s a lid a (b ) " P O R P G " (c ) " P O R N G "

NG N P PG
1 1 1

0.8 0.8 0.8

0.6 0.6 0.6

0.4 0.4 0.4

0.2 0.2 0.2

0 0 0
-4 -2 0 2 4 -4 -2 0 2 4 -4 -2 0 2 4

(d ) " P G O R N " (e ) " P G O R P G " (f) " N G O R N G "

1 1 1

0.8 0.8 0.8

0.6 0.6 0.6

0.4 0.4 0.4

0.2 0.2 0.2

0 0 0
-4 -2 0 2 4 -4 -2 0 2 4 -4 -2 0 2 4

Figura 4.20: Funciones de membresía para las variables de salida; (a) Funciones de salidas
(b) Gráfica de la operación ( P OR PG ); (c) Gráfica de la operación ( P OR NG ); (d)
Gráfica de la operación ( PG OR N ); (e) Gráfica de la operación ( PG OR PG ) y (f) (b)
Gráfica de la operación ( NG OR NG ).
4.4 Aplicación en tiempo real 65

del módulo Fu , las cuales, son el resultado de aplicar el operador mínimo y el índice de
aproximación φ al nuevo proceso de reducción, figura 4.18 y 4.19.
Del ejemplo anterior, note que el número de reglas difusas reales descritas por la figura
4.14 para el diseño convencional difuso consiste en realidad de 36 reglas difusas. Sin embargo,
mediante la aplicación del método L-HFS, el número total de reglas difusas han sido reducidas
a un total de 21 reglas. Obsérvese también, que el modelo entrada-salida del sistema barra-
esfera antes y después de la descomposición L-HFS es similar uno con respecto al otro tal y
como se muestra a continuación.

4.4. Aplicación en tiempo real


Es esta sección se explora el potencial práctico de los controladores difusos jerárquicos
para controlar la posición de la esfera en el sistema riel-esfera. El desempeño de los sistemas
difusos jerárquicos en el capítulo 3, ha sido evaluado mediante simulaciones numéricas, sin
embargo, para que un controlador difuso jerárquico pueda ser aplicado a un sistema físico
real de control, éste debe ser probado en un equipo con características iguales o por lo menos
similares a la planta real. Para este fin, se utilizó el prototipo riel-esfera propuesto original-
mente por Ortiz7 [22], en el cual se probaron ambos controladores difuso, el convencional y
el jerárquico, a fin de referenciar uno con respecto al otro.

4.4.1. Descripción del sistema


Los experimento descritos en esta sección se llevaron cabo en el sistema riel-esfera ubicado
en el Centro de Servicios Experimentales (CSE) del Departamento de Control Automático
(DCA) del CINVESTAV-IPN, el cual consta de dos vigas paralelas de metal unidas en el
extremo izquierdo por un pivote fijo y en el extremo derecho unidos mediante una barra
metálica la cual es unida a un motor de CD. Específicamente, el sistema riel-esfera, desliza
una esfera sobre el riel o barra larga de metal y el motor de DC es usado para mover o
7
Originalmente usado para el modelado y control PD-difuso en tiempo real de este sistema.
66 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

Figura 4.21: Descripción del sistema riel esfera.

cambiar la posición de la barra con respecto al eje horizontal a fin de enviar la esfera al
lugar deseado, figura 4.21. De acuerdo a Ortiz [22], el sistema riel-esfera es caracterizado por
cuatro variables de estado: r1 (posición de la esfera), ṙ2 (velocidad de la esfera), θ (posición
angular de la barra con respecto al eje horizontal) y θ̇ (velocidad angular de la barra) por
lo que en particular en esta aplicación definiremos el dominio de interés como el hipercubo
[−1,5, 1,5] × [−1,5, 1,5] × [−0,2, 0,2] × [−0,4, 0,4] en el espacio de estado cuatro-dimensional
x = (r, ṙ, θ, θ̇).

En particular, los ejemplos para esta aplicación, sugieren el uso del controlador difuso de
tipo Sugeno debido a las limitaciones de implementación que presenta el controlador difuso
de tipo Mamdani8 . En contraste con esto el controlador difuso de tipo Sugeno sugiere ser
más eficiente en cálculos, implementación y en métodos de adaptación (learning) Jang [10].

Al igual que para los otros ejemplos mostrados en este capítulo, a continuación se analiza
paso a paso el diseño del controlador difuso jerárquico para el sistema riel-esfera en tiempo
real.

8
Esto es debido a que este tipo de controlador difuso es más de un arte y menos de un enfoque de ingeniería
[9]
4.4 Aplicación en tiempo real 67

F1

F3

F2

Figura 4.22: Estructura del jerárquica para el sistema barra-esfera en tiempo real.

4.4.2. Construcción del controlador difuso jerárquico para el sis-


tema riel-esfera

Al haber definido el dominio de entrada para el sistema barra-esfera y basados en las


condiciones descritas en la subsección anterior, comencemos a describir paso a paso la con-
strucción del L-HFS correspondiente al sistema riel-esfera.
Paso 1: La estructura HFS para el sistema barra-esfera es descrita por la figura 4.22
y la figura 4.23 muestra la tabla correspondiente a la base de reglas del controlador difuso
para un sistema convencional de lógica difusa de una sola capa, construido a través de las
siguientes reglas difusas del tipo si-Entonces

Regla 1 : si r es A y ṙ es C y θ es E y θ̇ es G =⇒ u1 (4.29)
u1 = 1,015r + 2,234ṙ − 12,67θ − 1,046θ̇ + 0,02624
Regla 2 : si r es A y ṙ es C y θ es E y θ̇ es H =⇒ u2
u2 = 1,161r + 1,969ṙ − 9,396θ − 6,165θ̇ + 0,474
Regla 3 : si r es A y ṙ es C y θ es F y θ̇ es G =⇒ u3
u3 = 1,506r + 2,234ṙ − 12,99θ − 1,865θ̇ + 1,426
Regla 4 : Si r es A y ṙ es C y θ es F y θ̇ es H =⇒ u4
u4 = 0,7339r + 1,969ṙ − 9,381θ − 4,688θ̇ − 0,8804
68 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

Regla 5 : si r es A y ṙ es D y θ es E y θ̇ es G =⇒ u5 (4.30)
u5 = 0,7343r + 2,234ṙ − 12,85θ − 6,11θ̇ − 1,034
Regla 6 : si r es A y ṙ es D y θ es E y θ̇ es H =⇒ u6
u6 = 1,413r + 1,969ṙ − 9,485θ − 6,592θ̇ + 1,159
Regla 7 : si r es A y ṙ es D y θ es F y θ̇ es G =⇒ u7
u7 = 1,225r + 2,234ṙ − 12,8θ − 3,929θ̇ + 0,3662
Regla 8 : si r es A y ṙ es D y θ es F y θ̇ es H =⇒ u8
u8 = 0,9853r + 1,969ṙ − 9,291θ − 5,115θ̇ − 0,195

Regla 9 : si r es B y ṙ es C y θ es E y θ̇ es G =⇒ u9 (4.31)
u9 = 0,9853r + 1,969ṙ − 9,291θ − 5,115θ̇ + 0,195
Regla 10 : si r es B y ṙ es C y θ es E y θ̇ es H =⇒ u10
u10 = 1,225r + 2,234ṙ − 12,8θ − 3,929θ̇ − 0,3662
Regla 11 : si r es B y ṙ es C y θ es F y θ̇ es G =⇒ u11
u11 = 1,413r + 1,969ṙ − 9,485θ − 6,592θ̇ − 1,159
Regla 12 : si r es B y ṙ es C y θ es F y θ̇ es H =⇒ u12
u12 = 0,7343r + 2,234ṙ − 12,85θ − 6,11θ̇ + 1,034

Regla 13 : si r es B y ṙ es D y θ es E y θ̇ es G =⇒ u13 (4.32)


u13 = 0,7339r + 1,969ṙ − 9,381θ − 4,688θ̇ + 0,8804
Regla 14 : si r es B y ṙ es D y θ es E y θ̇ es H =⇒ u14
u14 = 1,506r + 2,234ṙ − 12,99θ − 1,865θ̇ − 1,426
Regla 15 : si r es B y ṙ es D y θ es F y θ̇ es G =⇒ u15
u15 = 1,161r + 1,969ṙ − 9,396θ − 6,165θ̇ − 0,474
Regla 16 : si r es B y ṙ es D y θ es F y θ̇ es H =⇒ u16
u16 = 1,015r + 2,234ṙ − 12,67θ − 1,046θ̇ − 0,02624
4.4 Aplicación en tiempo real 69

V
VI
VII
VIII

I II III VI

Figura 4.23: Reglas difusas para el ejemplo en tiempo real del sistema riel-esfera .

1 1 1 1 1
en donde A = 4, B = 4, C = 4, D = 4, E = 4,
1+| x+1,5
1,5 |
1+| x−1,5
1,5 |
1+| x−1,5
1,5 |
1+| x−1,5
1,5 |
1+| x+0,2
0,2 |
1 1 1
F = 4, G = 4 y H = 4 son las funciones de membresía para el
1+| x−0,2
0,2 |
1+| x+0,4
0,4 |
1+| x−0,4
0,4 |

antecedente y u = F (r, ṙ, θ, θ̇) es una función en la consecuencia.


Paso 2: De acuerdo a la figura 4.23 fije r, ṙ y use el método de mapeo L-HFS para
obtener las variables de mapeo I, II, III y IV . Construya las reglas para el módulo Fr
como muestra la figura 4.24. Por tanto, las base de reglas difusas del tipo Si-entonces para
el módulo Fr son

Si r es A y ṙ es C, entonces ur es I (4.33)
Si r es A y ṙ es D, entonces ur es II
Si r es B y ṙ es D, entonces ur es III
Si r es B y ṙ es D, entonces ur es IV

Paso 3: De manera similar fije θ y θ̇, use nuevamente el método de mapeo L-HFS para
obtener el mapeo de las variables correspondientes y construya las reglas correspondientes
70 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

Reglas para F1 o Fr

Reglas para F3 o Fu

Reglas para F2 o Fθ

Número de Reglas = F1 +F2 +F3 =24

Figura 4.24: Unidades Fr , Fθ y Fu para el sistema barra-esfera.

para el módulo Fθ , figura 4.24. La base de reglas para el módulo Fθ es

Si r es E y ṙ es G, entonces ur es V (4.34)
Si r es E y ṙ es H, entonces ur es V I
Si r es F y ṙ es G, entonces ur es V II
Si r es F y ṙ es H, entonces ur es V III

Hemos concluido con el proceso


Sin embargo continuar la construcción de la base difusas para el módulo Fu resultaría
inútil, dado que el número de reglas se ha incrementado considerablemente y supera en
número a las definidas previamente en el ejemplo, véase las figuras 4.23 y 4.24.
Ante esta circunstancias, el método de inferencia difusa de tipo Sugeno sugiere un método
más práctico y sencillo para redefinir los módulos correspondiente, en lugar de emplear el
método de inferencia difusa de tipo Mamdani.
4.4 Aplicación en tiempo real 71

A continuación, a fin de ilustrar el método para redefinir los módulos correspondiente, se


describe paso a paso la reconstrucción de los módulos respectivos al sistema riel-esfera.
Paso 1.1: Defina las salidas correspondientes para cada base de reglas difusas, esto es,
la nueva base de reglas difusas para el módulo Fr es definida por

Regla 1 : Si r es A y ṙ es C, entonces ur1 = a1 r + b1 ṙ + c1 (4.35)


Regla 2 : Si r es A y ṙ es D, entonces ur2 = a2 r + b2 ṙ + c2
Regla 3 : Si r es B y ṙ es D, entonces ur3 = a3 r + b3 ṙ + c3
Regla 4 : Si r es B y ṙ es D, entonces ur4 = a4 r + b4 ṙ + c4

en donde ai , bi y ci son constantes de la función de salida de cada regla. De igual forma se


tiene que la base de reglas difusas para el módulo Fθ es

Regla 1 : Si θ es E y θ̇ es G, entonces uθ1 = a1 θ + b1 θ̇ + c1 (4.36)


Regla 2 : Si θ es E y θ̇ es H, entonces uθ2 = a2 θ + b2 θ̇ + c2
Regla 3 : Si θ es F y θ̇ es G, entonces uθ3 = a3 θ + b3 θ̇ + c3
Regla 4 : Si θ es F y θ̇ es H, entonces uθ4 = a4 θ + b4 θ̇ + c4

Paso 1.2: Para redefinir el módulo Fu , Aplique el operador producto algebraico9 , figuras
4.25 y 4.26 respectivamente.
Paso 1.3: Para construir el módulo Fu : Utilice la figura 4.22 y determine la base de
reglas difusas de acuerdo al número de funciones de membresía definas para cada entrada,
asegurando que por cada entrada se utilice la función de membresía correspondiente al paso
1.2.
Paso 1.4: Por último defínase la base de reglas difusas y las salidas correspondientes

9
Vea [14] y [15] para más información acerca del operador.
72 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

(a) Funciones de membresía de entrada (b) Funciones de membresía de entrada


1.2 1.2
A C
B D
1 1

Grado de membresía

Grado de membresía
0.8 0.8

0.6 0.6

0.4 0.4

0.2 0.2

0 0
-6 -4 -2 0 2 4 6 -6 -4 -2 0 2 4 6
x x

(c) Producto algebraico (d) Producto algebraico

0.25 0.25
Grado de membresía

Grado de membresía
0.2 0.2

0.15 0.15

0.1 0.1

0.05 0.05

0 0
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
x x

Figura 4.25: Tipos de funciones de membresía para el sistema barra esfera.(a) Membresías
de entrada para la variable r (b) Membresías de entrada para la variable ṙ (c) Producto
algebraico A∗ = A · B y (c) Producto algebraico B ∗ = C · D.

(a) Funciones de membresía de entrada (b) Funciones de membresía de entrada


1.2 1.2
E G
F H
1 1
Grado de membresía

Grado de membresía

0.8 0.8

0.6 0.6

0.4 0.4

0.2 0.2

0 0
-1 -0.5 0 0.5 1 -1.5 -1 -0.5 0 0.5 1 1.5
x x

(c) Producto algebraico (d) Producto algebraico

0.25 0.25
Grado de membresía

Grado de membresía

0.2 0.2

0.15 0.15

0.1 0.1

0.05 0.05

0 0
-1.5 -1 -0.5 0 0.5 1 1.5 -1.5 -1 -0.5 0 0.5 1 1.5
x x

Figura 4.26: Tipos de funciones de membresía para el sistema barra esfera.(a) Membresías
de entrada para la variable θ (b) Membresías de entrada para la variable θ̇ (c) Producto
algebraico C ∗ = E · F y (c) Producto algebraico D∗ = G · H.
4.4 Aplicación en tiempo real 73

Figura 4.27: El sistema riel-esfera.

para el módulo Fu :

Regla 1 : Si ur es A∗ y uθ es C ∗ , entonces u1 = a1 ur + b1 uθ + c1 (4.37)


Regla 2 : Si ur es A∗ y uθ es D∗ , entonces u2 = a2 ur + b2 uθ + c2
Regla 3 : Si ur es B ∗ y uθ es C ∗ , entonces u3 = a3 ur + b3 uθ + c3
Regla 4 : Si ur es B ∗ y uθ es D∗ , entonces u4 = a4 ur + b4 uθ + c4

Las reglas descritas por 4.35, 4.36 y 4.37 son lo que deseábamos para Fr , Fθ , y Fu respecti-
vamente.
A continuación para validar el desempeño de este sistemas difuso jerárquico en el sistema
riel esfera se presentan los resultados experimentales.

4.4.3. Implementación al sistema real y resultados experimentales


De acuerdo a Ortiz [22], para controlar el sistema riel-esfera, figura 4.27, en tiempo real
es necesario crear el sistema de control correspondiente a través de los programas RTWT10
y RTW11 , en donde Matlab es usado como interfaz entre la línea de comando y el RTWT.
Por otra parte el RTW traduce los bloques de simulink, figura 4.28, a código C para generar
el ejecutable que permita la ejecución del sistema en tiempo real.
10
El Real Time Windows Target es utilizado para crear sistemas de control en tiempo real, para mayor
referencia de este véase Ortiz [22],
11
Real Time Workshop, para mayor referencia véase Ortiz [22],
74 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

7 .7
Esfera
s+7 s+.7
Filtro 2 Filter3
Par
Posición de la esfera

Señal de control 1
Motor
s+1
Filtro 1
0
Sistema Ball-Beam Posición del motor
Constante

phi

Par Saturación Referencia


r

Controlador
start stop remove
Señal de error

Figura 4.28: Diagrama a bloques en simulink para el controlador en tiempo real del sistema
riel-esfera usado por Ortiz [22].

Una vez que ha programado adecuadamente la computadora del sistema riel-esfera, el


primer experimento consistió en inserta el módulo de control difuso jerárquico, figura 4.29,
en el bloque de simulink utilizado en [22], figura 4.28.
De manera similar, el controlador difuso convencional, figura 4.30, fue insertado en el
módulo de control utilizado por Ortiz.
Note que el controlador difuso convencional utiliza la base de reglas descritas por (4.29),
(4.30), (4.31) y (4.32) respectivamente y controlador difuso jerárquico utiliza la siguientes
bases de reglas correspondientes a cada módulo jerárquico.

1. Módulo Fr :

Regla 1 : Si r es A y ṙ es C, entonces ur1 = r + 2,1ṙ


Regla 2 : Si r es A y ṙ es D, entonces ur2 = 0,005r + 1,2ṙ
Regla 3 : Si r es B y ṙ es D, entonces ur3 = 0,9r + 0,9ṙ − 0,2315
Regla 4 : Si r es B y ṙ es D, entonces ur4 = 3,2r + 0,5ṙ − 0,2315

1 1 1 1
en donde A = 4, B= 4, C= 4 yD= 4.
1+| x+1,5
1,5 |
1+| x−1,5
1,5 |
1+| x−1,5
1,5 |
1+| x−1,5
1,5 |
4.4 Aplicación en tiempo real 75

2
r

du/dt
Módulo difuso Módulo difuso
Derivador Fr Fu

2.5 1
Par
Ganancia
1
phi

0.3

Constante du/dt
Módulo difuso
Derivador1 Fteta

Figura 4.29: Diagrama de bloques en simulink para el controlador en tiempo real del sistema
riel-esfera jerárquico.

2. Módulo Fθ

Regla 1 : Si θ es E y θ̇ es G, entonces uθ1 = 0,475θ − 0,001θ̇ + 0,009


Regla 2 : Si θ es E y θ̇ es H, entonces uθ2 = 0,8θ + 0,1θ̇ − 0,0005
Regla 3 : Si θ es F y θ̇ es G, entonces uθ3 = 0,8θ − 0,25θ̇ + 0,009
Regla 4 : Si θ es F y θ̇ es H, entonces uθ4 = 0,95θ + 0,725θ̇ − 0,0008

1 1 1 1
en donde E = 4, F = 4, G= 4 yH= 4.
1+| x+0,2
0,2 |
1+| x−0,2
0,2 |
1+| x+0,4
0,4 |
1+| x−0,4
0,4 |

3. Módulo Fu

Regla 1 : Si ur es A∗ y uθ es C ∗ , entonces u1 = −0,1ur + 0,001uθ + 0,025


Regla 2 : Si ur es A∗ y uθ es D∗ , entonces u2 = 0,75ur − 0,001uθ − 0,474
Regla 3 : Si ur es B ∗ y uθ es C ∗ , entonces u3 = 0,1ur + 0,001uθ + 1,426
Regla 4 : Si ur es B ∗ y uθ es D∗ , entonces u4 = −0,0001ur − 0,001uθ − 0,8804

1 1 1 1
en donde A∗ = 6, B∗ = 6, C∗ = 9 y D∗ = 9.
1+| x+0,5
0,5 |
1+| x−0,5
0,5 |
1+| x+0,5
0,4 |
1+| x−0,5
0,4 |

Al emplear el método L-HFS en el sistema riel-esfera, el número total de reglas difusas em-
pleadas es de 12 reglas, esto significa que existen 4 reglas difusas por cada bloque jerárquico.
Por otra parte, es fácil ver que el número de reglas difusas se han reducido cuando el sistema
76 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

2
r

du/dt

Derivador
1 1
1 Par
Ganancia
phi Bloque difuso convencional

0.3

Constante
du/dt

Derivador 1

Figura 4.30: Diagrama de bloques en simulink para el controlador en tiempo real del sistema
riel-esfera de lógica convencional.

jerárquico, figura 4.29, es comparado con el sistema difuso convencional, figura 4.30, el cual
contiene 16 reglas difusas. Las figuras 4.31 y 4.32, muestran los resultados de la simulación
en tiempo real del sistema barra-esfera para el método difuso jerárquico (L-HFS) y el método
convencional de una sola capa. Como puede observarse en la figura 4.31, el desempeño logra-
do con el controlador difuso jerárquico de 12 reglas difusas es cualitativamente similar a los
obtenidos con el controlador difuso jerárquico de 16 reglas difusas, el controlador PD-difuso
y el controlador PD, figura 4.31(b), 4.33 y 4.34 respectivamente. Cuantitativamente los re-
sultados experimentales deseados en este trabajo son diferentes a los esperados, debido a que
el diseño de las reglas del controlador difuso convencional fueron construidas a través de un
modelo representativo de Matlab12 y en el cual no fueron modelados los efectos de la fricción
no lineal, saturación y zona muerta del sistema riel-esfera real. La figura 4.32 muestra los
efectos causados por la zona muerta y el cascabeleo mecánico en la unión de los engranes.
Para disminuir los efectos causados este tipo de perturbaciones mecánicas y dinámicas no
consideradas en el sistema riel-esfera, surgió la necesidad de realizar algunas modificaciones
al sistema de control propuesto por Ortiz y a la ganancia de salida del controlador difuso
jerárquico.

12
Sistema ball-beam.
4.4 Aplicación en tiempo real 77

(a ) S is te m a d ifu s o je rá rq u ic o
6
S e ñ a l d e s a lid a
4 R e fe re n c ia
P osición de la esfera
2

-2

-4

-6
0 20 40 60 80 100 120 140 160 180 200
tie m p o (s e g und o s )

(b ) S is te m a d ifu s o c o n v e n c io n a l d e u n a s o la c a p a
6
S e ñ a l d e s a lid a
4 R e fe re n c ia
P osición de la esfera

-2

-4

-6
0 20 40 60 80 100 120 140 160 180 200
tie m p o (s e g und o s )

Figura 4.31: Resultados de la aplicación en tiempo real del sistema barra-esfera. (a) Sistema
difuso jerárquico de 12 reglas y (b) sistema difuso convencional de una sola capa de 16 reglas.
(a ) S is te m a d ifu s o je rá rq u ic o

5
Señal de control

-5

0 20 40 60 80 100 120 140 160 180 200


tie m p o (s e g und o s )

(b ) S is te m a d ifu s o c o n v e n c io n a l d e u n a s o la c a p a

5
S eñal de control

-5

0 20 40 60 80 100 120 140 160 180 200


tie m p o (s e g und o s )

Figura 4.32: Señal de control (a) para el sistema difuso jerárquico y (b) para el sistema
convencional de la lógica difusa.
78 Sistemas difusos jerárquicos vía mapeo de variables para control difuso

C o n tro la d o r P D c o n c o m p e n s a d o r d ifu s o d e 4 re g la s d ifu s a s


3
S e ñ a l d e s a lid a
S e ñ a l d e re fe re n c ia

1
Posición de la esfera

-1

-2

-3
0 10 20 30 40 50 60 70 80 90
tie m p o (s e g und o s )

Figura 4.33: Salida de control PD-difuso para el sistema riel-esfera.

P o s ic ió n d e la e s fe ra
3
S e ñ a l d e s a lid a
R e fe re n c ia
2

1
Posición

-1

-2

-3
0 1000 2000 3000 4000 5000 6000
T ie m p o (6 0 s )

Figura 4.34: Salida de control PD para el sistema riel-esfera.


4.5 Conclusiones del capítulo 79

4.5. Conclusiones del capítulo


Las limitaciones causadas por la maldición de la dimensionalidad, sugirieron una nueva
metodología para el diseño de sistema difusos a través del uso de una estructura jerárquica.
Mediante la aplicación de esta estructura jerárquica al sistema difuso convencional del
sistema riel-esfera, el presente capítulo, ha validado el funcionamiento de las estructuras
jerárquicas a través del método L-HFS. El cual, fue presentado, de tal forma que uno puede
fácilmente diseñar las reglas difusas del sistema en forma jerárquica mediante el uso del
método de mapeo de variables y el índice de aproximación φ.
En contraste con el método convencional de una sola capa, este nuevo método de estruc-
turas jerárquicas elimina el fenómeno causado por la maldición de la dimensionalidad y por
supuesto valida la ventaja de usar estos sistemas en el diseño del control difuso.
80 Sistemas difusos jerárquicos vía mapeo de variables para control difuso
Capítulo 5

Conclusiones y trabajos futuros

En el presente trabajo se introdujo un algoritmo jerárquico de aprendizaje tipo backprop-


agation para la identificación de sistemas sin utilizar estructuras complejas de entrenamiento
y un algoritmo para el diseño de controladores difusos jerárquicos. La investigación de esta
nueva tecnología para el área del control permite contribuir de manera más eficiente a la
solución de problemas en las áreas de la ingeniería y la de la ciencia exacta.
En la actualidad, el avance tecnológico y los métodos modernos de control hacen posible
que los ingenieros diseñen sistemas de control confiables y caracterizables, sin embargo con-
forme las plantas modernas con muchas entradas y salidas se vuelven más y más complejas,
el análisis y la implementación de este tipo de controladores se torna más difícil debido a la
maldición de la dimensionalidad.
En este proyecto, se analizaron las propiedades que ofrecen los sistemas difusos jerárquicos
y además el diseño de estos mediante el uso de dos enfoques diferentes. Una conclusión casi
obvia con respecto a los sistemas difusos jerárquicos es la habilidad de aproximar algunas
funciones no lineales a cualquier exactitud prescrita en un dominio compacto. En contraste
a esta última, no existe una conclusión general acerca de cual entrada en un sistema difuso
jerárquico tiene más influencia en la salida del sistema.
Por otra parte, se considero que en este trabajo de investigación se alcanzaron los objetivos
que eran esencialmente:
82 Conclusiones y trabajos futuros

Crear nuevos enfoques para la construcción de controladores difusos y

El diseño, implementación y análisis de estos a ciertos sistemas con el fin de comprobar


su fiabilidad y efectividad.

En la primera fase de este proyecto, se mostró que el algoritmo jerárquico de aprendizaje


tipo backpropagation ofrece buenos resultados al identificar sistemas no lineales. A partir
de estos experimentos se concluye que el uso de este algoritmo simple de aprendizaje evita
en gran medida el tratar con los algoritmos convencionales de aprendizaje y consecuente-
mente con estructuras complejas y deficiencias en las velocidades de convergencia de dichos
algoritmos.

Para la segunda fase de este trabajo, un sistema difuso jerárquico fue desarrollado para
el sistema barra-esfera a través del mapeo de variables intermedias. Aunque, los ejemplos
presentados en este trabajo fueron para sistemas de pocas variables, las ideas pueden ser
extendidas para sistemas difusos jerárquicos de mayor orden, como se ejemplifica en los dos
algoritmos propuestos para la construcción de sistemas jerárquicos.

Al implementar el controlador difuso jerárquico en tiempo real, se comparó su respuesta


con la entregada por el sistema convencional de la lógica difusa y a su vez con las señales
obtenidas por los controladores propuestos en [22], observando que las señales de control
correspondientes a cada controlador, presentan un mínimo de error en el objetivo del control
y logran la estabilidad de la esfera en la posición deseada. Por tanto, de esta forma se
concluye que los sistemas difusos jerárquicos eliminan la maldición de la dimensionalidad
y sugieren ser empleados en cualquier dominio de aplicación donde el objetivo principal
del ingeniero de diseño sea el de resolver problemas de control sin la necesidad de emplear
algoritmos complejos y por supuesto con un mínimo de recursos computacionales para su
implementación.
5.1 Trabajos futuros 83

5.1. Trabajos futuros


Considerando lo presentado en este trabajo, adicionalmente se pueden realizar algunas
observaciones importantes y realizar a corto y mediano plazo lo siguiente:

Análisis de estabilidad del sistema, en particular para la planta riel-esfera, con el méto-
do de Lyapunov.

Análisis de estabilidad para el algoritmo de aprendizaje tipo backpropagation

Modelado de las dinámicas no lineales del sistema barra-esfera, esto a fin de evitar
algunas perturbaciones no deseadas.

Identificación del sistema riel-esfera a partir del método propuesto.

Realización un control difuso de orden superior al propuesto que logre estabilizar al


sistema riel-esfera en lazo

Investigar el efecto que tienen las variables de entradas a la salida de un sistema difuso
jerárquico.

Investigar el efecto en el orden de relación que tienen las variables de entradas en cada
bloque difuso.
84 Conclusiones y trabajos futuros
Bibliografía

[1] D. Abramovitch, Some Crisp Thoughts on Fuzzy Logic, In the Proceedings of the 1994
American Controls Conference in Baltimore, MD, June 1994.

[2] M. Brown, C.J Harris, Neurofuzzy Adaptive Modelling and Control, Prentice Hall: New
York, 1994.

[3] M. Brown, K.M Bossley, D.J. Mills and C.J. Harris, High Dimensional Neurofuzzy Sys-
tems: overcoming the curse of the dimensionality, Proc. IEEE International Conference,
1995, pp. 2139-2146.

[4] M.Y. Chen and D.A. Linkensm, A systematic neuro-fuzzy modeling framework with
aplication to material property prediction, IEEE Trans. Syst. Man, Cybern. B, Vol 13,
781-790, 2001.

[5] D.S. Chen and R.C Jain, A robust back propagation learning algorithm for function
approximation, IEEE Trans. Neural Networks, Vol.5, No.3, 1994.

[6] Fu-Lau Chung and Ji-Cheng Duan, On Multistage Fuzzy Neural Network Modeling,
IEEE Transactions on Fuzzy Systems, Vol. 8. No.2, 125-142, Abril 2000.

[7] J.H. Friedman, Multivariable adaptive regression splines, Ann. Statistics, Vol. 19, No.1,
pp. 1-141, 1991.
86 BIBLIOGRAFÍA

[8] S. Ferrari, M. Maggioni and N.A. Borghese, Multiscale Approximation with Hierarchical
Radial Basis Function Network, IEEE Transactions on Neural Networks, Vol. 15. No.1,
178-188, January 2004.

[9] Jang, J.-S. R. and N. Gulley, "Gain scheduling based fuzzy controller design,"Proc. of
the International Joint Conference of the North American Fuzzy Information Process-
ing Society Biannual Conference, the Industrial Fuzzy Control and Intelligent Systems
Conference, and the NASA Joint Technology Workshop on Neural Networks and Fuzzy
Logic, San Antonio, Texas, Dec. 1994.

[10] J.S. Roger Jang, ANFIS: Adaptive-network-based fuzzy inference system, IEEE Trans-
actions on Systems, Man and Cybernetics, Vol. 23, 665-685, 1993.

[11] Jyh-Shing R. J., Chuen-Tsai S. y Eiji M., Neuro-Fuzzy and Soft Computing: a computa-
tional approach to learning and machine intelligence ,Prentice-Hall, Inc, Upper Saddle
River: NJ, 1997

[12] M.G. Joo, J.S. Lee, Hierarchical fuzzy control scheme using Takagi-Sugeno type infer-
ence, Proc. IEEE Internat. Conf. on Fuzzy Systems,1999, pp. 78-83.

[13] Kaufman Arnold , Introduction to the Theory of fuzzy Subsets Vol.1,Academic Press
1975

[14] Kaufman Arnold , Madan M. Gupta, Fuzzy Mathematical models in engineering and
management science , North-Holland 1988.

[15] Gorge J. Klir, Bo Yuan, Fuzzy sets and fuzzy logic “ Theory and applications”, Prentice
Hall Upper Saddle River, New Jersey, 1995

[16] C.T. Lin and G. Lee, Neural fuzzy systems: A neural-fuzzy synergism to intelligent
systems, Prentice Hall Inc, NJ, 1996.

[17] C.T. Lin, A neural fuzzy control system with structure and parameter learning, Fuzzy
Sets and Systems, Vol.70, 183-212, 1995.
BIBLIOGRAFÍA 87

[18] J. Lin, Hierarchical fuzzy logic controller for a flexible link robot arm performing con-
strained motion task, IEEE Proc.-Control Theory Appl, Vol. 150, No. 4 pp. 355-364,
July 2003.

[19] M.L. Lee, H.Y. Chung and F.M. Yu, Modeling of hierarchical fuzzy systems, Fuzzy sets
and systems, 138, 343-361, 2003.

[20] M.C. Mackey and L. Glass, Oscillation and chaos in physiological control systems, Sci.,
Vol. 197, pp. 287-289, Julio 1997.

[21] K. Ogata, Ingenería de control moderna, Prentice Hall Hispanoamericana, 1998.

[22] F.Ortiz, Modelado y control PD-difuso en tiempo real para el sistema barra-esfera. Msc.
thesis, Cinvestav-IPN, 2004.

[23] Kevin M. Passino, S. Yurkovich, Fuzzy Control , Addison Wesley Longman Inc. 1998.

[24] Marek J. Patyra, Janos L. Grantn and Kirby K. , Digital Fuzzy logic Controller: Design
and Implementation , IEEE Transactions on Fuzzy Systems, Vol.4, No.4, 439-459, Nov
1996.

[25] G.V.S. Raju, J. Zhou, Adaptive Hierarchical fuzzy control, IEEE Transactions on Sys-
tems, Man and Cybernetics, vol 23, No.4, pp 973-980, July/August 1993.

[26] W. Rattasiri and S.K. Halgamuge, Computationally Advantageous and Stable Hierar-
chical Fuzzy Systems for Active Suspension, IEEE Trans. on Industrial Electronics, Vol
50, 306-319, 1994.

[27] Shuwei G. and Liliane P., Design and Applications of an Analog Fuzzy Logic Controller,
IEEE Transactions on Fuzzy Systems, Vol.4, No.4, 429-438, Nov 1996.

[28] L.X. Wang, A course in fuzzy systems and control, Prentice Hall Inc., 1997.

[29] L.X. Wang, Analysis and Design of Hierarchical Fuzzy Systems, IEEE Transactions on
Fuzzy Systems, Vol. 7, No. 3, 671-624, 1999.
88 BIBLIOGRAFÍA

[30] C. Wei and L.X. Wang, A Note on Universal Approximation by Hierarchical Fuzzy
Systems, Information Sciences, Vol. 123, 241-248, 2000.

[31] Wen Yu and Xiaoou Li, Fuzzy identification using fuzzy neural networks with stable
learning algoritms, IEEE Transactions on Fuzzy Systems, Vol. 12, No.3, 411-420, 2004.

[32] Waratt Rattasiri and Saman K. Halgamuge, Computationally Advantageous and Stable
Hierarchical Fuzzy Systems for Active Suspension, IEEE Transactions on Industrial
Electronics, Vol. 50, No.1, 48-61, February 2003.

[33] S.Wu and M.J.Er, Dynamic fuzzy neural networks- a novel approach to function ap-
proximation, IEEE Trans. Syst., Man, Cybern. B, Vol.30, 358-364, 2000.

[34] R.R. Yager, “On the construction of Hierarchical Fuzzy Systems Models”, IEEE Trans.
Syst., Man, Cybern. C, Vol.28, 55-66, 1998.

[35] H. Ying and G. Chen, “Necessary conditions for some typical fuzzy systems as universal
approximators”, Automatica, vol. 33, no. 7, pp. 1333-1338, 1997.

[36] X.J. Zeng and M. G. Singh, “Approximation theory of fuzzy systems-MIMO case”,
IEEE Trans. Fuzzy Syst., vol.3, pp. 219-235, Nov. 1995.

[37] J. Zhou, G. V. S. Raju, and R.A Kisner, “Hierarchical Fuzzy Systems”, Int. J. Control,
Vol.54, No.5, pp. 1201-1216, 1991.

También podría gustarte