Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clase Ta5
Clase Ta5
y las Comunicaciones
Departamento de Ingeniera de la Informacion
Universidad de Murcia
Conjuntos difusos
Definicin: los conjuntos difusos sirven para realizar una evaluacin cualitativa de
alguna cantidad fsica [Zad65].
En los conjuntos difusos se establece un grado de pertenencia, de forma que un elemento
pertenece a un conjunto difuso con cierto grado.
Un conjunto difuso A en el dominio X se define mediante un conjunto de pares
ordenados:
A = {(x, A (x)) |x X }
de pertenencia para el conjunto difuso A:
donde A (x) es la funcion
A : X [0, 1]
La funcin de pertenencia asigna a cada elemento x X un valor entre 0 y 1, dicho
valor es el grado de pertenencia de x al conjunto A.
X es el universo de discurso (discreto o continuo)
Definiciones bsicas
El soporte de un conjunto difuso A es el conjunto de todos los puntos x X tales que
su funcin de pertenencia es mayor que 0:
soporte (A) = {x X |A (x) > 0}
El nucleo
montona:
T (a, b) T (c, d) si a c y b d
conmutativa:
T (a, b) = T (b, a)
asociativa:
producto algebraico:
Tp (a, b) = ab
producto acotado:
Tpa (a, b) = m
ax (0, a + b 1) = 0 (a + b 1)
Producto drstico:
(Zadeh)
(Luckasiewicz)
montona:
S (a, b) S (c, d) si a c y b d
conmutativa:
S (a, b) = S (b, a)
asociativa:
Smax (a, b) = m
ax (a, b) = a b
suma algebraica:
Ss (a, b) = a + b ab
suma acotada:
suma drstica :
(Zadeh)
(Luckasiewicz)
Funciones de pertenencia
Funcin de pertenencia triangular:Esta funcin se define mediante tres parmetros
{a, b, c} de la siguiente forma:
a,b,c (x) =
0,
xa ,
ba
cx
,
cb
0,
si x a
si a x b
si b x c
si c x
a,b,c,c (x) =
0,
xa
ba ,
si x a
si a x b
1,
si b x c
dx
,
dc
si c x d
0,
si d x
a,b,c,d (x) = m
ax mn
dx
xa
, 1,
ba
dc
,0
Los parmetros {a, b, c, d} determinan las coordenadas de las cuatro esquinas del
trapecio definido por la funcin.
Defuzzyficacin
El proceso de defuzzificacin permite asociar a un conjunto difuso un nmero no difuso.
Esto se realiza para calcular el valor de salida de los modelos difusos. La defuzzificacin
puede realizarse de varias formas.
Centro del rea (COA): Asocia el centro del rea formada por el nmero difuso. Este
es uno de los mtodos ms utilizados. Matemticamente se expresa de la siguiente
forma:
R
(y)ydy
y = RY
Y (y)dy
Media del mximo (MOM): Realiza la media de los valores mximos del conjunto
difuso. Matemticamente se define de la siguiente forma:
R
Y0
y= R
Y0
ydy
dy
ZERO
ZERO
NFULL
ZERO
PFULL
Consecuente
V. angular (7fs)
V. lineal (11fs)
NLARGE
PLARGE
NZERO
NMEDIUM
PMEDIUM
NLARGE
NSMALL
PSMALL
NXLARGE
ZERO
ZERO
NFULL
PSMALL
NSMALL
NXLARGE
PMEDIUM
NMEDIUM
NLARGE
PLARGE
NLARGE
NZERO
y Aplicaciones. Juan A. Bota p.13/42
Tratamiento Inteligente de la Informacion
1.0
1.0
0.5
0.5
0.0
0.0
1.0
1.0
0.5
0.5
0.0
0.0
1.0
1.0
0.5
0.5
0.0
0.0
x es A1
(x,y)
y es B1
x es A2
y es B2
w11
w12
w21
w22
REGLA 1
AGREGADOR DE
ANTECEDENTES
w1
z es C1
F1
AGREGADOR DE
REGLAS
REGLA 2
AGREGADOR DE
ANTECEDENTES
w2
z es C2
F2
F
DEFUZZIFICADOR
2.
3.
4.
5.
defusificar
Para inferir una salida a partir de una entrada hay que proporcionar
del
una interpretacin de las conectivas difusas (interpretacion
mecanismo de inferencia)
salida
MIMO (Multiple Inputs Multiple Outputs):
variables de salida
MISO (Multiple Inputs Single Output)
de salida
Variables involucradas:
reglas completas:
reglas incompletas:
ADEMAS
R1 : SI x es
A2 ENTONCES z es C2
Rr : SI x es Ar ENTONCES z es Cr
Rset (x, z) = max(Rc1 (x, z), . . . , Rcr (x, z))
P
Rset (x, z) = algebraica (Rc1 (x, z), . . . , Rcr (x, z))
y Aplicaciones. Juan A. Bota p.22/42
Tratamiento Inteligente de la Informacion
Ejemplo
Para el par de reglas
R1 : SI x es A1 ENTONCES z es C1
R2 : SI x es A2 ENTONCES z es C2
B1
A1
C1
A2
x1
B2
x2
C2
SALIDA
sin defuzzificar
Geomtricamente, las reglas del modelo TSK corresponden a una aproximacin de la funcin original mediante una combinacin de
funciones lineales.
Las funciones lineales pueden remplazarse por otras no lineales
Interpretacin
1.
2.
3.
i=1
y =
r
P
i y i
i=1
Ejemplo
Modelado Neuro-Difuso
los sistemas de inferencia difusos proporcionan un mecanismo
intuitivo y de alto nivel para representar el conocimiento
las redes neuronales [Cyb88, Bis95], poseen un alto grado de
adaptabilidad y capacidad de aprendizaje y generalizacin
las herramientas que se nutren de estas dos reas son un
mecanismo eficiente a la hora de modelar sistemas reales: las redes
adaptativas neuro-difusas [CW96, Jan93, JSM97]
El enfoque ms extendido es el de usar backpropagation en
sistemas difusos
1.
2.
3.
odelado Neuro-Difuso con Redes Neuronales con Funciones de Base Radial (RBFN
Arquitectura
capa oculta formada funciones de base radial R i , tpicamente Ri es gaussiana:
kx ci k2
Ri (x) = exp
2i2
La capa de salida tiene un solo nodo
suma ponderada de las salidas de cada neuronal de la capa oculta:
y=
c
X
wi Ri (x)
i=1
R1
x1
c1
R2
c2
\sum
c3
R3
c4
x2
R4
wi = fi (x) = ai x + bi
donde ai y bi son los parmetros asociados a la salida de la neurona i-sima
la salida obtenida por la red RBFN es:
y=
Pc
siendo idntica a la producida por un sistema de inferencia difuso TSK de primer orden si
El nmero de neuronas es igual al nmero de reglas
RBFN y FIS tienen el mismo mtodo de agregacin (suma ponderada o media ponderada)
para calcular la salida total.
Las funciones de base radial son de pertenencia multidimensional para el antecedente de cada
regla del sistema
La salida de cada regla del FIS y de la red RBFN debe tener la misma funcin de respuesta:
en el caso de una funcin lineal de primer orden, fi (x) = aT
i x + bi , resulta equivalente
a un sistema de inferencia TSK de primer orden,
en el caso de una constante, fi (x) = bi , entonces resulta equivalente a un sistema de
inferencia TSK de orden cero.
y Aplicaciones. Juan A. Bota p.30/42
Tratamiento Inteligente de la Informacion
Ri (~
x) = exp
p
X
j=1
|xj cij
2
2ij
|2
p
Y
"
|xj cij
=
exp
2
2ij
j=1
|2
p
Y
Aij
j=1
La salida total del modelo se calcula sumando las contribuciones individuales de cada
regla utilizando la media ponderada
En el caso de una funcin lineal de primer orden:
fi (x) = i1 x1 + . . . + ip xn + i(p+1)
T
donde i = [i1 , . . . , i(p+1) ]T = [aT
i ; bi ] es el vector de parmetros del
consecuente
1
(yk tk )2
2
Ek
i
T
T T
donde: i = 1, . . . , r, i = [cT
i ; i ; i ] son los parmetros asociados a la regla
i-sima y es el ratio de aprendizaje.
ji
xj cji
Ek
fi (x) yk
= (tk yk )
Ri (x)
2
cji
z
ji
(xj cji )2
Ek
fi (x) yk
Ri (x)
=
= (tk yk )
3
ji
z
ji
ij =
Ek
1
= (tk yk ) Ri (x)xj
ij
z
donde i = 1, . . . , r, j = 1, . . . , p, y z =
c
P
i=1
Ri (x).
y Aplicaciones. Juan A. Bota p.33/42
Tratamiento Inteligente de la Informacion
ANFIS, Arquitectura
x1 , . . . , x p
.
.
.
A11
...
...
A1p
PP11
PP
P
1p
...
Arp
PPr1
PP
P
a11 , . . . , a1p , b1
.
.
.
.
.
.
.
.
.
Ar1
\
\ y1
\
\P
yr
ar1 , . . . , arp , br
rp
.
.
.
capa 0
capa1
capa2
capa3
capa4
capa5
1
x ci 2bi
j
j
1 + ai j
i = 1, . . . , c, j = 1, . . . , p,
donde xi es la entrada y {aij , bij , cij } es el conjunto de parmetros. O por ejemplo, una
gaussiana:
x ci 2
Aij = e
ai
j
i = 1, . . . , c, j = 1, . . . , p,
i =
p
Y
i = 1, . . . , r,
ij
j=1
k=1
yi = i ai1 x1 . . . + aip xp + bi
Si los parmetros de los antecedentes quedan fijos, la salida y puede ser reescrita
entonces de la siguiente manera
y
1 (a11 x1 + . . . + a1p xp + b1 )
+...+
(1)
r (ar1 x1 + . . . + arp xp + br )
y esta ecuacin puede reescribirse como:
f =
(2)
1 x1 a11 + . . . + 1 xp a1p + 1 b1
+...+
r x1 ar1 + . . . + r xp arp + r br
Mtodo global
combinar el mtodo de backpropagation con el mtodo de cuadrados
mnimos para modificar los parmetros de la red
cada poca est compuesta por una pasada hacia adelante y una
pasada hacia atrs.
Hacia adelante para cada vector de entrada, se evala la red
hasta la capa 4, y los parmetros de los consecuentes son
identificados mediante el mtodo de cuadrados mnimos
se calculan los errores para cada par del conjunto de
entrenamiento y, en la pasada hacia atrs se propagan las
seales del error y los parmetros de las premisas son
modificados por el mecanismo clsico de backpropagation
Referencias
[Bis95]
Christopher M. Bishop, Neural networks for pattern recognition, Clarendon Press, Oxford, 1995.
[Cas95]
J. L. Castro, Fuzzy logic controllers are universal approximators, IEEE Transactions on System, Man and
Cybernetics 25 (1995), no. 4, 629635.
[CW96]
K. B. Cho and B. H. Wang, Radial basis function based adaptive fuzzy systems and their application to system
identification and prediction, Fuzzy Sets and Systems 83 (1996), 325339.
[Cyb88]
[Jan93]
J.S. Jang, Anfis: Adaptive-network-based fuzzy inference systems, IEEE Trans. on Systems, Man, and
Cybernetics 23 (1993), no. 03, 665685.
[JSM97]
J.-S. R. Jang, C.-T. Sun, and E. Mizutani, Neuro-fuzzy and soft computing, Matlab Curriculum, Prentice Hall,
1997.
[Kos92]
B. Kosko, Fuzzy systems as universal approximators, Proceedings of the IEEE International Conference on
Fuzzy Systems, 1992, pp. 11531161.
[SY93]
M. Sugeno and T. Yasukawa, A fuzzy logic based approach to qualitative modeling, IEEE Transactions on Fuzzy
Systems 1 (1993), no. 1, 731.
[Wan92] L. X. Wang, Fuzzy systems are universal approximators, Proceedings of the International Conference on Fuzzy
Systems (San Diego. USA), 1992, pp. 11631170.
[Zad65]