Está en la página 1de 42

Sistemas Difusos

Lgica difusa y sistemas difusos aplicados al anlisis


inteligente de datos
Vela
Juan A. Bota Blaya y Mercedes Valdes
juanbot@um.es, mvaldes@dif.um.es

y las Comunicaciones
Departamento de Ingeniera de la Informacion
Universidad de Murcia

y Aplicaciones. Juan A. Bota p.1/42


Tratamiento Inteligente de la Informacion

Conjuntos difusos
Definicin: los conjuntos difusos sirven para realizar una evaluacin cualitativa de
alguna cantidad fsica [Zad65].
En los conjuntos difusos se establece un grado de pertenencia, de forma que un elemento
pertenece a un conjunto difuso con cierto grado.
Un conjunto difuso A en el dominio X se define mediante un conjunto de pares
ordenados:
A = {(x, A (x)) |x X }
de pertenencia para el conjunto difuso A:
donde A (x) es la funcion

A : X [0, 1]
La funcin de pertenencia asigna a cada elemento x X un valor entre 0 y 1, dicho
valor es el grado de pertenencia de x al conjunto A.
X es el universo de discurso (discreto o continuo)

y Aplicaciones. Juan A. Bota p.2/42


Tratamiento Inteligente de la Informacion

Definiciones bsicas
El soporte de un conjunto difuso A es el conjunto de todos los puntos x X tales que
su funcin de pertenencia es mayor que 0:
soporte (A) = {x X |A (x) > 0}
El nucleo

de un conjunto difuso A es el conjunto de todos los puntos x X tales que


su funcin de pertenencia es igual a 1:
n
ucleo (A) = {x X |A (x) = 1}
Un conjunto difuso A es normal si su ncleo es no vaco, es decir, si siempre podemos
encontrar un punto x X tal que A (x) = 1.
Se dice que A es un conjunto difuso singleton si su soporte es un solo punto x X con
A (x) = 1.
Un conjunto difuso A es convexo si y solo si para todo x 1 , x2 X y para todo [0, 1]:
A (x1 + (1 ) x2 ) mn {A (x1 ) , A (x2 )}
de forma alternativa, A es convexo si A es convexo, para todo [0, 1].
y Aplicaciones. Juan A. Bota p.3/42
Tratamiento Inteligente de la Informacion

Operaciones con cjtos. difusos


T -norma/Interseccin difusa: La interseccin entre dos conjuntos A y B es otro
conjunto difuso C = A B cuya funcin de pertenencia se calcula a partir de las
funciones de pertenencia de A y B mediante una funcin T : [0, 1] [0, 1] [0, 1]
que realiza la agregacin de dos grados de pertenencia de la siguiente forma:
C (x) = AB (x) = T (A (x), B (x)) = A (x)
B (x)
donde
es un operador binario para la funcin T .
Satisfacen, al menos, los siguientes axiomas para todo a, b, c [0, 1]:
condicin de lmite:

T (0, 0) = 0, T (a, 1) = T (1, a) = a

montona:

T (a, b) T (c, d) si a c y b d

conmutativa:

T (a, b) = T (b, a)

asociativa:

T (a, T (b, c)) = T (T (a, b) , c)

y Aplicaciones. Juan A. Bota p.4/42


Tratamiento Inteligente de la Informacion

Operaciones con cjtos. difusos (II)


Algunos de los operadores T -norma ms frecuentes son:
mnimo:

Tmin (a, b) = mn (a, b) = a b

producto algebraico:

Tp (a, b) = ab

producto acotado:

Tpa (a, b) = m
ax (0, a + b 1) = 0 (a + b 1)

Producto drstico:

Tpd (a, b)={a, si b = 1; b si a = 1; 0 si a, b < 1}

(Zadeh)
(Luckasiewicz)

T -conorma/Unin difusa: La unin de dos conjuntos difusos A y B es otro conjunto


difuso C = A B cuya funcin de pertenencia se calcula a partir de las funciones de
pertenencia de A y B mediante una funcin S : [0, 1] [0, 1] [0, 1] que realiza la
agregacin de dos grados de pertenencia de la siguiente forma:
B (x)
C (x) = AB (x) = S (A (x), B (x)) = A (x)+
es un operador binario para la funcin S.
donde +

y Aplicaciones. Juan A. Bota p.5/42


Tratamiento Inteligente de la Informacion

Operaciones con cjtos. difusos (II)


satisfacen, al menos, los siguientes axiomas para todo a, b, c [0, 1]:
condicin de lmite:

S (1, 1) = 1, S (0, a) = S (a, 0) = a

montona:

S (a, b) S (c, d) si a c y b d

conmutativa:

S (a, b) = S (b, a)

asociativa:

S (a, S (b, c)) = S (S (a, b) , c)

Algunos de los operadores T -conormas ms frecuentes son:


mximo:

Smax (a, b) = m
ax (a, b) = a b

suma algebraica:

Ss (a, b) = a + b ab

suma acotada:

Ssa (a, b) = mn (1, a + b) = 1 (a + b)

suma drstica :

Ssd (a, b) = {a, si b = 0; y si a=0; 1 si a, b > 0}

(Zadeh)
(Luckasiewicz)

y Aplicaciones. Juan A. Bota p.6/42


Tratamiento Inteligente de la Informacion

Funciones de pertenencia
Funcin de pertenencia triangular:Esta funcin se define mediante tres parmetros
{a, b, c} de la siguiente forma:

a,b,c (x) =

0,

xa ,
ba
cx
,
cb

0,

si x a
si a x b
si b x c
si c x

Una forma de expresin alternativa es la siguiente:




 
xa cx
a,b,c (x) = m
ax mn
,
,0
ba cb
Los parmetros {a, b, c} determinan las coordenadas de las tres esquinas del
tringulo definido por la funcin.

y Aplicaciones. Juan A. Bota p.7/42


Tratamiento Inteligente de la Informacion

Funciones de pertenencia (II)


Funcin de pertenencia trapezoidal: se especifica mediante cuatro parmetros
{a, b, c, d} de la forma:

a,b,c,c (x) =

O expresado de forma ms concisa:

0,

xa

ba ,

si x a

si a x b

1,

si b x c

dx
,
dc

si c x d

0,

si d x

a,b,c,d (x) = m
ax mn

dx
xa
, 1,
ba
dc

,0

Los parmetros {a, b, c, d} determinan las coordenadas de las cuatro esquinas del
trapecio definido por la funcin.

y Aplicaciones. Juan A. Bota p.8/42


Tratamiento Inteligente de la Informacion

Funciones de pertenencia (III)


Funcin de pertenencia bell-shaped: se especifica mediante tres parmetros {a, b, c} de
la forma:
1
a,b,c (x) =
xc 2b

1+
a

donde el parmetro b es normalmente positivo (si fuera negativo, la forma de esta


funcin sera la de una campana invertida)

Funcin de pertenencia sigmoidal: se define mediante dos parmetros {a, c} de la


forma:
1
a,c (x) =
1 + exp [a (x c)]
donde a controla la pendiente en el punto de cruce x = c. Dependiendo del signo del
parmetro a, la funcin sigmoidal es abierta a derecha o izquierda.

y Aplicaciones. Juan A. Bota p.9/42


Tratamiento Inteligente de la Informacion

Defuzzyficacin
El proceso de defuzzificacin permite asociar a un conjunto difuso un nmero no difuso.
Esto se realiza para calcular el valor de salida de los modelos difusos. La defuzzificacin
puede realizarse de varias formas.
Centro del rea (COA): Asocia el centro del rea formada por el nmero difuso. Este
es uno de los mtodos ms utilizados. Matemticamente se expresa de la siguiente
forma:
R
(y)ydy
y = RY
Y (y)dy
Media del mximo (MOM): Realiza la media de los valores mximos del conjunto
difuso. Matemticamente se define de la siguiente forma:
R

Y0

y= R

Y0

ydy
dy

donde Y 0 = {y Y 0 | (y) = } y es el valor mximo de la funcin de


pertenencia.

y Aplicaciones. Juan A. Bota p.10/42


Tratamiento Inteligente de la Informacion

Modelado Difuso de Sistemas


El modelado difuso es un enfoque relativamente novedoso para la construccin de
modelos de sistemas utilizando un lenguaje descriptivo basado en la lgica difusa con
predicados difusos [SY93].
Se describe el comportamiento de los sistemas de forma cualitativa, usando el
lenguaje natural.
Un modelo difuso es una descripcin de un sistema con cantidades difusas.
Las cantidades difusas se expresan como nmeros difusos que pueden tener
asociadas variables lingsticas.

y Aplicaciones. Juan A. Bota p.11/42


Tratamiento Inteligente de la Informacion

Modelado Difuso de Sistemas


Ejemplo: el controlador de la carretilla para la maniobra de atraque
Es una funcin f (et ) que proporciona salidas para el par (v , vl )
Definimos el error de la trayectoria con siete conjuntos difusos triangulares
grado de pertenencia

NLARGE NMEDIUM NSMALL

PSMALL PMEDIUM PLARGE

ZERO

Tambin la velocidad angular


grado de pertenencia

NLARGE NMEDIUM NSMALL

ZERO

PSMALL PMEDIUM PLARGE

y Aplicaciones. Juan A. Bota p.12/42


Tratamiento Inteligente de la Informacion

Modelado Difuso de Sistemas


Tambin la velocidad lineal con 11 conjuntos triangulares
grado de pertenencia

NFULL

NXLARGE NLARGE NMEDIUM NSMALL

ZERO

PSMALL PMEDIUM PLARGE PXLARGE

PFULL

Y el conjunto de reglas queda


Antecedente

Consecuente

Er. trayectoria (7fs)

V. angular (7fs)

V. lineal (11fs)

NLARGE

PLARGE

NZERO

NMEDIUM

PMEDIUM

NLARGE

NSMALL

PSMALL

NXLARGE

ZERO

ZERO

NFULL

PSMALL

NSMALL

NXLARGE

PMEDIUM

NMEDIUM

NLARGE

PLARGE

NLARGE

NZERO
y Aplicaciones. Juan A. Bota p.13/42
Tratamiento Inteligente de la Informacion

Representacin genrica de un modelo difuso


R1 : SI x11 es A11 Y x12 es A12 Y . . . Y x1p es A1p ENTONCES y es B1
R2 : SI x21 es A21 Y x22 es A22 Y . . . Y x2p es A2p ENTONCES y es B2

Rr : SI xr1 es Ar1 Y xr2 es Ar2 Y . . . Y xrp es Arp ENTONCES y es Br


p es el nmero de variables de entrada
r es el nmero de reglas
xj con 1 j p, es la j-sima variable de entrada
Aij , con 1 i r, es el conjunto difuso asociado a la variable de entrada j-sima en
la regla i-sima
y es la variable de salida
Bi es el conjunto difuso asociado a la variable de salida en la i-sima regla

y Aplicaciones. Juan A. Bota p.14/42


Tratamiento Inteligente de la Informacion

Ventajas del modelado difuso


Favorece la incorporacin del conocimiento experto
existente acerca del sistema que se est modelando
Alta interpretabilidad
Cuando existen datos entrada-salida sobre el sistema
se pueden utilizar tcnicas de identificacin de
sistemas clsicas para realizar el proceso de modelado
Modelado Difuso Conducido por Datos

y Aplicaciones. Juan A. Bota p.15/42


Tratamiento Inteligente de la Informacion

Caractersticas Deseables en un Modelo Difuso

Objetivo A: conseguir capacidad aproximativa


los modelos difusos son aproximadores universales
[Wan92, Kos92, Cas95]
Objetivo B: conseguir transparencia o interpretabilidad
capacidad para incorporar conocimiento experto
explicar el funcionamiento de un sistema mediante
reglas SI-ENTONCES
nos permiten entender la influencia de cada entrada
en la salida

y Aplicaciones. Juan A. Bota p.16/42


Tratamiento Inteligente de la Informacion

Caractersticas Deseables en un Modelo Difuso (II)

1. Distinguibilidad: trmino lingstico con significado tanto


ms claro cuanto ms se puedan diferenciar las
funciones de pertenencia.
2. Normalidad: para cada funcin de pertenencia debe
existir al menos un elemento en el universo con grado
de pertenecia mximo (1)
3. Numero

de funciones de pertenencia moderado: nmero de


entidades diferentes que pueden ser manejadas de
forma eficiente por la memoria, entre 7 y 9
4. Cubrimiento: se debe cubrir todo el espacio de la
variable representada

y Aplicaciones. Juan A. Bota p.17/42


Tratamiento Inteligente de la Informacion

Caractersticas Deseables en un Modelo Difuso (III)

1.0

1.0

0.5

0.5

0.0

0.0

1.0

1.0

0.5

0.5

0.0

0.0

1.0

1.0

0.5

0.5

0.0

0.0

y Aplicaciones. Juan A. Bota p.18/42


Tratamiento Inteligente de la Informacion

Elementos de un Modelo Difuso


Para un sistema con dos reglas

x es A1

(x,y)

y es B1

x es A2
y es B2

w11
w12
w21
w22

REGLA 1
AGREGADOR DE
ANTECEDENTES

w1

z es C1

F1
AGREGADOR DE
REGLAS

REGLA 2
AGREGADOR DE
ANTECEDENTES

w2

z es C2

F2

F
DEFUZZIFICADOR

y Aplicaciones. Juan A. Bota p.19/42


Tratamiento Inteligente de la Informacion

Interpretacin de las conectivas difusas


La entrada al sistema puede ser difusa o real (crisp)
Para obtener la salida debida a la entrada
1.

determinar el grado de cumplimiento de cada una de las

proposiciones difusas atomicas


de los antecedentes

2.

calcular el grado de cumplimiento del antecedente de cada regla,


agregando las proposiciones atmicas mediante la conectiva Y

3.

realizar las implicaciones SI EN T ON CES

4.

la agregacin de las reglas debida a la conectiva ADEMAS

5.

defusificar

Para inferir una salida a partir de una entrada hay que proporcionar
del
una interpretacin de las conectivas difusas (interpretacion
mecanismo de inferencia)

y Aplicaciones. Juan A. Bota p.20/42


Tratamiento Inteligente de la Informacion

Clasificacin de modelos difusos


Dependiendo del nmero de variables de entrada y salida
SISO (Single Inputs Single Output)

formados por una variable de entrada y una de

salida
MIMO (Multiple Inputs Multiple Outputs):

mltiples variables de entrada y mltiples

variables de salida
MISO (Multiple Inputs Single Output)

: modelos mltiples entradas y una sola variable

de salida
Variables involucradas:
reglas completas:

en todas las reglas que conforman el modelo difuso, estn


involucradas las mismas variables de entrada

reglas incompletas:

reglas formadas por subconjuntos (no necesariamente iguales)


del conjunto total de variables (aquellas que no aparecen se les asume grado de
pertenencia 1)
segn el Tipo de Consecuente
Modelos con consecuente difuso
Modelos relacionales
Modelos TSK (Takagi-Sugeno-Kang
y Aplicaciones. Juan A. Bota p.21/42
Tratamiento Inteligente de la Informacion

Interpretacin del mtodo de razonamiento difuso

Modelos con consecuente difuso


Conectiva Y (x es A Y y es B)
min(A (c), B (y))
Q
(A (c), B (y))

Implicacin (Si x es A ENTONCES y es B)


min(A (c), B (y))
Q
(A (c), B (y))

Agregacin de reglas (agregacin equivale a disyuncin)


R1 : SI x es A1 ENTONCES z es C1

ADEMAS
R1 : SI x es

A2 ENTONCES z es C2

Rr : SI x es Ar ENTONCES z es Cr
Rset (x, z) = max(Rc1 (x, z), . . . , Rcr (x, z))
P
Rset (x, z) = algebraica (Rc1 (x, z), . . . , Rcr (x, z))
y Aplicaciones. Juan A. Bota p.22/42
Tratamiento Inteligente de la Informacion

Ejemplo
Para el par de reglas
R1 : SI x es A1 ENTONCES z es C1
R2 : SI x es A2 ENTONCES z es C2

B1

A1

C1

A2
x1

B2
x2

C2

SALIDA
sin defuzzificar

y Aplicaciones. Juan A. Bota p.23/42


Tratamiento Inteligente de la Informacion

Interpretacin del mtodo de razonamiento difuso

Modelos TSK: los consecuentes de las reglas son


funciones polinomiales de las variables de entrada
SI x1 es A11 Y . . . Y xp es A1p ENTONCES y1 = a11 (x1 , ..., xp ) Y . . . Y yh = a1h (x1 , ..., xp )
SI x1 es A21 Y . . . Y xp es A2p ENTONCES y1 = a21 (x1 , ..., xp ) Y . . . Y yh = a2h (x1 , ..., xp )
...
SI x1 es Ar1 Y . . . Y xp es Arp ENTONCES y1 = ar1 (x1 , ..., xp ) Y . . . Y yh = arh (x1 , ..., xp )

Geomtricamente, las reglas del modelo TSK corresponden a una aproximacin de la funcin original mediante una combinacin de
funciones lineales.
Las funciones lineales pueden remplazarse por otras no lineales
Interpretacin
1.

Supongamos una nica variable a la salida

2.

hay que calcular el grado de disparo de cada regla, i , con i = 1, . . . , r


i = T (Ai1 (x1 ), . . . , Aip (xp )),

3.

La salida y se obtiene de la siguiente forma:


r
P

i=1
y =
r
P

i y i

i=1

siendo yi el consecuente de la regla i-sima


y Aplicaciones. Juan A. Bota p.24/42
Tratamiento Inteligente de la Informacion

Ejemplo

y Aplicaciones. Juan A. Bota p.25/42


Tratamiento Inteligente de la Informacion

Modelado difuso guiado por datos


En anlisis de datos, buscamos una funcin objetivo f , que
aproximamos mediante f, obtenida apartir de datos de aprendizaje
En el modelado difuso tramaos de encontrar un sistema de
inferencia difusa para representar f y aproximar f
Debemos entonces determinar
El tipo de sistema de inferencia (TSK, etc)
Interpretacin de las conectivas
El nmero de conjuntos difusos para cada variable de entrada y
salida
El nmero de reglas
Los cjtos. difusos de cada regla
Otros

y Aplicaciones. Juan A. Bota p.26/42


Tratamiento Inteligente de la Informacion

Modelado Neuro-Difuso
los sistemas de inferencia difusos proporcionan un mecanismo
intuitivo y de alto nivel para representar el conocimiento
las redes neuronales [Cyb88, Bis95], poseen un alto grado de
adaptabilidad y capacidad de aprendizaje y generalizacin
las herramientas que se nutren de estas dos reas son un
mecanismo eficiente a la hora de modelar sistemas reales: las redes
adaptativas neuro-difusas [CW96, Jan93, JSM97]
El enfoque ms extendido es el de usar backpropagation en
sistemas difusos
1.

el controlador difuso se transforma en una red reuronal

2.

la red se entrena mediante backpropagation

3.

han de utilizarse operadores diferenciables en el FRM y


funciones de pertenencia diferenciables para los conjuntos
difusos
y Aplicaciones. Juan A. Bota p.27/42
Tratamiento Inteligente de la Informacion

odelado Neuro-Difuso con Redes Neuronales con Funciones de Base Radial (RBFN

Arquitectura
capa oculta formada funciones de base radial R i , tpicamente Ri es gaussiana:


kx ci k2
Ri (x) = exp
2i2
La capa de salida tiene un solo nodo
suma ponderada de las salidas de cada neuronal de la capa oculta:
y=

c
X

wi Ri (x)

i=1

media ponderada de los valores de salida asociados con cada neurona:


Pc
i=1 wi Ri (x)
y= P
c
i=1 Ri (x)

y Aplicaciones. Juan A. Bota p.28/42


Tratamiento Inteligente de la Informacion

Modelado Neuro-Difuso con Redes de Funciones de Base Radial (RBFN)

R1
x1

c1

R2

c2
\sum

c3
R3
c4

x2

R4

y Aplicaciones. Juan A. Bota p.29/42


Tratamiento Inteligente de la Informacion

Equivalencia con TSK


Si asignamos una funcin lineal a la salida de cada neurona:
T

wi = fi (x) = ai x + bi
donde ai y bi son los parmetros asociados a la salida de la neurona i-sima
la salida obtenida por la red RBFN es:

y=

Pc

i=1 Ri (x)fi (x)


PM
i=1 Ri (x)

siendo idntica a la producida por un sistema de inferencia difuso TSK de primer orden si
El nmero de neuronas es igual al nmero de reglas
RBFN y FIS tienen el mismo mtodo de agregacin (suma ponderada o media ponderada)
para calcular la salida total.
Las funciones de base radial son de pertenencia multidimensional para el antecedente de cada
regla del sistema
La salida de cada regla del FIS y de la red RBFN debe tener la misma funcin de respuesta:
en el caso de una funcin lineal de primer orden, fi (x) = aT
i x + bi , resulta equivalente
a un sistema de inferencia TSK de primer orden,
en el caso de una constante, fi (x) = bi , entonces resulta equivalente a un sistema de
inferencia TSK de orden cero.
y Aplicaciones. Juan A. Bota p.30/42
Tratamiento Inteligente de la Informacion

Ajuste de parmetros para una red RBF-TSK


El algoritmo de entrenamiento actualiza de forma incremental los parmetros (tanto de
los antecedentes como de los consecuentes) en base a los datos entrada-salida que
se le presentan
La funcin objetivo en este caso es el error cuadrtico medio.
El grado de disparo de una regla dada equivale al grado de disparo de una neurona y
viene dado mediante la composicin suma-producto de la forma:

Ri (~
x) = exp

p
X

j=1

|xj cij
2
2ij

|2

p
Y

"

|xj cij
=
exp
2
2ij
j=1

|2

p
Y

Aij

j=1

donde: ci = [ci1 , . . . , cip ]T es el vector de centros de la regla i-sima


i = [i1 , . . . , ip ]T es el vector de varianzas de la regla i-sima A ij , j = 1, . . . , p
son los conjuntos difusos del antecedente de la regla i-sima, definido cada uno por
una funcin de pertenencia gaussiana con parmetros (c ij , ij ).

y Aplicaciones. Juan A. Bota p.31/42


Tratamiento Inteligente de la Informacion

Ajuste de parmetros para una red RBF-TSK (II)

La salida total del modelo se calcula sumando las contribuciones individuales de cada
regla utilizando la media ponderada
En el caso de una funcin lineal de primer orden:
fi (x) = i1 x1 + . . . + ip xn + i(p+1)
T
donde i = [i1 , . . . , i(p+1) ]T = [aT
i ; bi ] es el vector de parmetros del
consecuente

Para el patrn de entrenamiento k-simo, el error E k es:


Ek =

1
(yk tk )2
2

donde yk es la salida real del modelo, y tk es la salida deseada para el vector de


entrada k-simo.

y Aplicaciones. Juan A. Bota p.32/42


Tratamiento Inteligente de la Informacion

Ajuste de parmetros para una red RBF-TSK (III)

La regla para realizar la actualizacin es la siguiente:


inew = iold + i = iold

Ek
i

T
T T
donde: i = 1, . . . , r, i = [cT
i ; i ; i ] son los parmetros asociados a la regla
i-sima y es el ratio de aprendizaje.

Los gradientes negativos de Ek con respecto a cada parmetro se calculan de la


siguiente forma:
cji =

ji

xj cji
Ek
fi (x) yk
= (tk yk )
Ri (x)
2
cji
z
ji

(xj cji )2
Ek
fi (x) yk
Ri (x)
=
= (tk yk )
3
ji
z
ji
ij =

Ek
1
= (tk yk ) Ri (x)xj
ij
z

donde i = 1, . . . , r, j = 1, . . . , p, y z =

c
P

i=1

Ri (x).
y Aplicaciones. Juan A. Bota p.33/42
Tratamiento Inteligente de la Informacion

Modelado Neuro-Difuso con ANFIS

La arquitectura ANFIS(Adaptive Neuro-based Fuzzy Inference


System) [Jan93, JSM97] es funcionalmente equivalente
a un sistema TSK.
La desarrollada a continuacin se corresponde con el
modelo TSK de consecuente lineal.
Los nodos situados en la misma capa realizan
funciones similares.
Los nodos representados con rectngulos son
adaptativos, mientras que los nodos representados por
crculos no lo son

y Aplicaciones. Juan A. Bota p.34/42


Tratamiento Inteligente de la Informacion

ANFIS, Arquitectura
x1 , . . . , x p
.
.
.

A11
...
...

A1p

PP11
PP
P




 1p

...
Arp

PPr1
PP
P





a11 , . . . , a1p , b1

.
.
.

.
.
.

.
.
.

Ar1

\
\ y1
\
\P


yr

ar1 , . . . , arp , br 

rp

.
.
.

capa 0

capa1

capa2

capa3

capa4

capa5

y Aplicaciones. Juan A. Bota p.35/42


Tratamiento Inteligente de la Informacion

Funcionalidad en las capas


Capa 0: corresponde a las entradas x1 , . . . , xp .
Capa 1: los nodos de esta capa son adaptativos, y cada uno calcula el grado de
pertenencia ij de la entrada j-sima al conjunto difuso Aij . Su funcin de
pertenencia puede definirse de varias maneras, teniendo en cuenta que ha de ser
diferenciable. Por ejemplo, podra ser una funcin bell-shaped:
Aij =

1
x ci 2bi
j
j
1 + ai j

i = 1, . . . , c, j = 1, . . . , p,

donde xi es la entrada y {aij , bij , cij } es el conjunto de parmetros. O por ejemplo, una
gaussiana:
 x ci 2

Aij = e

ai
j

i = 1, . . . , c, j = 1, . . . , p,

donde xi es la entrada y {aij , cij } es el conjunto de parmetros.

y Aplicaciones. Juan A. Bota p.36/42


Tratamiento Inteligente de la Informacion

Funcionalidad en las capas (II)


Capa 2: los nodos de esta capa son no adaptativos y se define la salida del nodo
i-simo como el producto de sus entradas:

i =

p
Y

i = 1, . . . , r,

ij

j=1

donde cada salida i corresponde al grado de disparo de la i-sima regla (usando la


T -norma del producto).
Capa 3: los nodos de esta capa son no adaptativos. El nodo i-simo obtiene el grado
de disparo normalizado de la regla i-sima
i = P r

k=1

y Aplicaciones. Juan A. Bota p.37/42


Tratamiento Inteligente de la Informacion

Funcionalidad en las capas (III)


Capa 4: cada nodo de esta capa es adaptativo y los parmetros del nodo i-simo son
ai1 , . . . , aip , bi . Su salida se corresponde con la salida parcial de la i-sima regla,


yi = i ai1 x1 . . . + aip xp + bi

Capa 5: el nodo de esta capa es no adaptativo y su salida se define como la suma de


las salidas parciales yi :
r
X
y=
yi
i=1

y Aplicaciones. Juan A. Bota p.38/42


Tratamiento Inteligente de la Informacion

Ajuste de parmetros en ANFIS


Basado en una combinacin de mnimos cuadrados y
backpropagation
Los nodos de la capa 1 y cuatro se corresponden,
respectivamente, con
los parmetros de los conjuntos difusos de los
antecedentes de un sistema TSK
los coeficientes de las funciones lineales de sus
consecuentes

y Aplicaciones. Juan A. Bota p.39/42


Tratamiento Inteligente de la Informacion

Mnimos cuadrados para los parmetros en los consecuentes

Si los parmetros de los antecedentes quedan fijos, la salida y puede ser reescrita
entonces de la siguiente manera
y

1 (a11 x1 + . . . + a1p xp + b1 )
+...+

(1)

r (ar1 x1 + . . . + arp xp + br )
y esta ecuacin puede reescribirse como:
f =
(2)

1 x1 a11 + . . . + 1 xp a1p + 1 b1
+...+
r x1 ar1 + . . . + r xp arp + r br

lineal en los parmetros de los consecuentes a i1 , . . . , aip , bi con i = 1, . . . , p.


Se puede aplicar mnimos cuadrados

y Aplicaciones. Juan A. Bota p.40/42


Tratamiento Inteligente de la Informacion

Mtodo global
combinar el mtodo de backpropagation con el mtodo de cuadrados
mnimos para modificar los parmetros de la red
cada poca est compuesta por una pasada hacia adelante y una
pasada hacia atrs.
Hacia adelante para cada vector de entrada, se evala la red
hasta la capa 4, y los parmetros de los consecuentes son
identificados mediante el mtodo de cuadrados mnimos
se calculan los errores para cada par del conjunto de
entrenamiento y, en la pasada hacia atrs se propagan las
seales del error y los parmetros de las premisas son
modificados por el mecanismo clsico de backpropagation

y Aplicaciones. Juan A. Bota p.41/42


Tratamiento Inteligente de la Informacion

Referencias
[Bis95]

Christopher M. Bishop, Neural networks for pattern recognition, Clarendon Press, Oxford, 1995.

[Cas95]

J. L. Castro, Fuzzy logic controllers are universal approximators, IEEE Transactions on System, Man and
Cybernetics 25 (1995), no. 4, 629635.

[CW96]

K. B. Cho and B. H. Wang, Radial basis function based adaptive fuzzy systems and their application to system
identification and prediction, Fuzzy Sets and Systems 83 (1996), 325339.

[Cyb88]

G. Cybenko, Approximation by superpositions of a sigmoidal function, Mathematics of Control, Signals, and


Systems 2 (19988), no. 4, 303314.

[Jan93]

J.S. Jang, Anfis: Adaptive-network-based fuzzy inference systems, IEEE Trans. on Systems, Man, and
Cybernetics 23 (1993), no. 03, 665685.

[JSM97]

J.-S. R. Jang, C.-T. Sun, and E. Mizutani, Neuro-fuzzy and soft computing, Matlab Curriculum, Prentice Hall,
1997.

[Kos92]

B. Kosko, Fuzzy systems as universal approximators, Proceedings of the IEEE International Conference on
Fuzzy Systems, 1992, pp. 11531161.

[SY93]

M. Sugeno and T. Yasukawa, A fuzzy logic based approach to qualitative modeling, IEEE Transactions on Fuzzy
Systems 1 (1993), no. 1, 731.

[Wan92] L. X. Wang, Fuzzy systems are universal approximators, Proceedings of the International Conference on Fuzzy
Systems (San Diego. USA), 1992, pp. 11631170.
[Zad65]

Lofti A. Zadeh, Fuzzy sets, Information and Control 8 (1965), 338353.

y Aplicaciones. Juan A. Bota p.42/42


Tratamiento Inteligente de la Informacion

También podría gustarte