Está en la página 1de 8

9.

Teoría De Dempster y Shafer

En 1967 Dempster propuso una teoría de probabilidades altas y bajas inducida


por mapeos múltiples de variables aleatorias. Más tarde (1976), Glenn Shafer
reformuló la misma teoría, derivándola de funciones de confianza (Belief). Esta
descripción retoma las bases del ejemplo de exploración petrolera mencionado
cuando comenzamos a introducir los sistemas expertos (C. Radu & R. Wilkinson,
“Using Fuzzy Set Theory”, IEEE Potentials, Dec ‘95/ Jan ’96, pp 33-35). También
hay aportes conceptuales posteriores realizados por Ruspini.

9.1. Definiciones

1. Marco de Discernimiento (Frame of Discernment):

Θ es el universo de las proposiciones a las que se evaluará su “confianza”.

2. Fuentes de Evidencia (Evidence Source):

Son las que generan el “grado de confianza” a subconjuntos del marco de


discernimiento. Dos fuentes de evidencia son Evidencialmente Independientes si los
errores que ocurren en cada fuente son independientes de la otra.

Sea S un conjunto finito de fuentes evidencialmente independientes que generan


las Asignaciones Probabilísticas Básicas (APB) (Basic Probability Assignments) para
varios subconjuntos de Θ. Sea n = |S| la cardinalidad de S. Cada fuente generará un
conjunto finito de APBs. La fuente Si puede ser interpretada como un mapeo de un
subconjunto del conjunto potencia de Θ al intervalo [0, 1], es decir,

Si : P(Θ) → [0, 1]

i i i i
Las APBs generadas por la fuente Si se definen como: m1 ( A1 ).....mti ( Ati ) ,tal
que :
ti
( Ak ) = 1 , y Ak ⊆ Θ, k = 1,....., t i
i i i
∑m
k =1
k

Como ejemplo, supongamos que Θ es finito, por ejemplo, |Θ|=10 y Θ = {Θ1,


Θ2,….., Θ10}. Supongamos que disponemos de tres fuentes S1, S2, S3, entonces se
obtienen las relaciones que se mencionan en la Tabla 9.1.
Tabla 9.1. Relaciones obtenidas con un espacio Θ finito
con cardinalidad igual a 10.
Fuente Asignaciones Probabilísticas Básicas
ti
Si m1i → A1i m2i → A2i m3i → A3i
S1 0, 2 → {Θ1,Θ2} 0,5 → {Θ3,Θ4,Θ7,Θ8} 0, 3 → {Θ} 3
S2 0, 2 → {Θ1} 0, 6 → {Θ2,Θ3,Θ4,Θ6,Θ7,Θ8} 0, 2 → {Θ} 3
S3 0, 3 →{Θ1,Θ2,Θ3} 0, 7 → {Θ3,Θ4,Θ5,Θ6,Θ7,Θ8} - 2

Nótese que cada fuente puede asignar APBs a singletons de Θ, subconjuntos no


necesariamente disjuntos de Θ, o todo el marco de discernimiento Θ. El primer tipo
de asignación (APBs a singletons) es similar a la teoría de probabilidades tradicional.
El segundo tipo de asignación (APBs a subconjuntos) representa una gran diferencia
de las probabilidades tradicionales, es decir, en vez de usar entropía máxima para
distribuir uniformemente la APB entre todos los elementos del subconjunto, la APB
se asocia directamente al subconjunto. El tercer tipo de asignación (APB al marco de
discernimiento de Θ) es una forma explícita de representar ignorancia (o no
compromiso).

3. Reglas de Combinación de Dempster:

Es la intersección de conjuntos aleatorios suponiendo que no hay correlación.

Ejemplo de combinación de fuentes es el siguiente: usando los datos del ejemplo


anterior, la combinación de la evidencia de las fuentes S1 y S2 se muestra en la Tabla
9.2.

Tabla 9.2. Resultados de combinación de las fuentes S1 y S2 de la Tabla 9.1.


S1×S2 S1
0,04 → {Θ1} 0,1 → ∅ 0,06 → {Θ1}
S2 0,12 → {Θ2} 0,3 → {Θ3,Θ4,Θ7,Θ8} 0,8 → {Θ2,Θ3,Θ4,Θ6,Θ7,Θ8}
0,04 → {Θ1,Θ2} 0,1 → {Θ3,Θ4,Θ7,Θ8} 0,06 → Θ

Si se combinan otras fuentes, podemos repetir el mismo procedimiento. Una vez


que se ha agrupado toda la información de todas las fuentes obtenemos la última
relación computada R.

La cardinalidad de R será |R| = t1 × …..tn . En general se podrá reducir |R|


aunando distintas asignaciones a subconjuntos idénticos.

Por ejemplo, en el caso anterior hay 9 cómputos que corresponden a 7


subconjuntos diferentes de Θ. Veamos la combinación de 3 fuentes, combinando S3
al resultado recién obtenido, la cual se especifica en la Tabla 9.3.
3.1. Consultas concretas basadas en datos concretos

Sea B ⊆ Θ un evento (consulta) cuya confianza queremos conocer. La respuesta


está representada por límites superior e inferior. Para fines de ejemplo, superior B =
{Θ1,Θ2} y usemos los datos combinados de S1 × S2 × S3.

3.1.1. Cota (límite) inferior (Lower Bound)

Es la cantidad de evidencia confirmatoria que entrega la evidencia (L(B)):


2
L( B ) = ∑ m( A S ) = L({Θ1 , Θ 2 }) = ∑ mi ({Θ1 }) + m({Θ 2 }) + m({Θ1 , Θ 2 })
AS ⊆ B i =1

L( B) = 0,012 + 0,018 + 0,036 + 0,012 = 0,078

3.1.2. Cota (límite) superior (Upper Bound)

Es la cantidad en que la evidencia no refuta al evento (U(B)):

U ( B) = 1 − L(~ B) = 1 − ∑ m( A S )= ∑ m( A S ) = U (Θ1 , Θ 2 )
AS ⊆ B AS ∩ B ≠φ
2
U ( B) = ∑ mi ({Θ1 }) + m({Θ 2 }) + m({Θ1 , Θ 2 }) + [m({Θ 2 , Θ 3 }) + m({Θ1 , Θ 2 , Θ 3 }) ]
i =1

U ( B) = 0,078 + [0,054 + 0,018] = 0,150

3.1.3. Medida de Conflicto C, y factor de Normalización K

El contenido de conflicto C de la información combinada está dada por las APBs


asignadas a ∅.
6
C = L(φ ) = ∑ m( AS ) = ∑ mi (φ ) = 0,03 + 0,028 + 0,07 + 0,042 + 0,084 + 0,028 = 0,282
AS =φ i =1

1
El factor de normalización K se define como K = .
1 − L(φ )

En este caso K = 1.393. Así, las cotas normalizadas L*(B) y U*(B) son:

L*(B) = K×L(B) = 1,393 × 0,078 = 0,1086


U*(B) = K×U(B) = 1,393 × 0,150 = 0,2089
Tabla 9.3. Resultados de combinación de las 3 fuentes de
la Tabla 9.1.
S1xS2 xS3 S3
0,012 → {Θ1}
0,03 → ∅
0,018 →{Θ1}
0,036 → {Θ 2 }

0,09 → {Θ3 }

0,054 → {Θ 2 , Θ3 }

0,012 → {Θ1, Θ 2 }

0,03 → {Θ3 }

S1xS2 0,018 → {Θ1, Θ 2 , Θ3 }


0,028 → ∅
0,07 → ∅
0,042 → ∅
0,084 → ∅
0,021 → {Θ3 , Θ4 , Θ7 , Θ8 }
0,126 → {Θ3 , Θ4 , Θ6 , Θ7 , Θ8 }
0,028 → ∅
0,07 → {Θ3 , Θ 4 , Θ7 , Θ8 }
0,042 → {Θ3 , Θ4 , Θ5 , Θ6 , Θ7 , Θ8 }

3.2. Consultas Difusas basadas en datos concretos

Si el evento B está definido por su función característica µB(x), x ∈ Θ, las cotas


superior e inferior pueden computarse como:
L( B) = ∑ m( AS ) × ( Λ µ ( x))
x∈ AS B
AS ⊆ Θ

U ( B) = ∑ m( A S )×( V
x∈ AS
µ B
( x))
AS ⊆ Θ

Nótese que si el evento B es concreto (es decir, no difuso), µB(x) sólo será 0 ó 1,
y las fórmulas anteriores se reducen al caso concreto definido anteriormente. Con
esto es posible determinar cotas superior o inferior de eventos que no pueden ser
bien definidos.

3.3. Consultas difusas basadas en datos difusos

También es posible generalizar los conceptos incluyendo datos difusos. Para ello
se definen las medidas de Necesidad (N(p|d)) y Posibilidad (Π(p|d)).
Se describe la Medida de Necesidad N(p|d) como el grado de “suposición
semántica” (Semantic Entailment) de un descriptor “p” dado un dato “d”. Si “p” tiene la
función característica µP(x), y µD(x) es la función característica del dato “d” (en que µP
y µD son X → [0,1], ∀ x ∈ X, en que X es el universo), la medida de necesidad
es:

N ( p | d ) = Λ (µ D ( x ) → µ P ( x ) ) = Λ (max [(1 − µ D ( x ), µ P ( x ) )]) = 1 − V (min [(1 − µ P ( x ), µ D ( x ) )])


x x x

La Medida de Posibilidad Π(p|d) representa el grado de intersección entre un dato


“d” y el descriptor “p”. Si se trata de los mismos “d” y “p” anteriores, el intervalo
[N(p|d), Π(p|d)] representa los límites del grado de ajuste (degree of matching) entre
el descriptor y el dato, y da la respuesta a la consulta.

La medida de posibilidad está dada por:

Π ( p | d ) = V(min[µ P ( x), µ D ( x) ])
x

Nótese que N(p|d) = 1-Π(~p|d), es decir, el grado de necesidad de un descriptor


“p” dado un dato “d” es equivalente al grado de imposibilidad de la negación del
descriptor, dado el mismo dato. En términos de la notación empleada anteriormente,
la medida de necesidad de un evento B dado AS es:

L( B ) = ∑ m( A S ) × N ( B | AS )
AS ⊆ Θ

que representa el límite inferior de verdad (Lower Bound).

Por otra parte, la medida de posibilidad de B dado AS representa el límite


superior, dado por:
U ( B) = ∑ m( AS ) × Π ( B | AS ) ç
AS ⊆ Θ

Ejemplo:

Consideremos una elección con 8 candidatos, luego el marco de discernimiento


es el conjunto Θ = { A, B, C, D, E, F, G, H}. El país es USA, por lo tanto, se refiere a
dólares, etc.

Características consideradas relevantes para el electorado, y el grado de


membresía de los distintos candidatos a tales características se dan en la Tabla 9.4.
Tabla 9.4. Grado de membresía de los 8 distintos candidatos dadas diversas
Características.
Características CANDIDATOS
A B C D E F G H
Apoyo Sindical 0 0 0 0 1 0 0 0
Afiliación Partidista (*) R R R L D D D I
Actualmente en ejercicio 1 0 0 0 0 0 0 0
(Incumbent)
Promesa de: 1 1 1 1 0 1 1 0
“No hacer nuevos Impuestos”
Moderado 0 1 1 0 1 0 1 1
No tiene (estado envuelto en) 0 1 1 1 1 1 1
escándalo
Carismático/Telegénico 0,8 0,2 1 0,5 1 0,7 0,9 0,5
Presupuesto para la Campaña 9M 3M 2M 0,5M 6M 2M 4,5M 1M
Edad 65 39 55 59 66 58 73 44
(*) Republicano, Demócrata, Liberal, Independiente

Notar que las primeras seis filas son conjuntos concretos y la séptima fila es un
conjunto difuso. Para usar esta información debemos hacer interpretaciones
adicionales: definamos los siguientes conjuntos difusos:
• Para el presupuesto de campaña:

Gran_Presupuesto_de_Campaña = (x; 3,5; 5; 10; 20)

• Para la edad:

MUY_JOVEN = (x, 18, 18, 30, 33)


JOVEN = (x, 28, 31, 39, 42)
EDAD_MEDIANA = (x, 41, 45, 55, 59)
MADURO = (x, 53, 55, 64, 67)
VIEJO = (x, 63, 65, 72, 74)
MUY_VIEJO = (x, 71, 73, 80, 100)

De estudios en el electorado, se ha obtenido la información siguiente. Los puntos


(importancia relativa) se ha asignado para que sume en una primera etapa 100 para
poder ser fácilmente traducible a asignaciones probabilísticas básicas.

1. Alrededor de un tercio (1/3) de los votantes son obreros sindicalizados. Al


menos la mitad de ellos son influenciados políticamente por la posición del
sindicato. 20 puntos para apoyo sindical.
2. La mayor parte (60%) del electorado es demócrata por registro. Sin embargo,
sólo un tercio (1/3) de ellos vota estrictamente de acuerdo al partido. 20 puntos
para demócratas.
3. El poder del candidato en ejercicio está siempre presente, en este caso
atenuado por su baja popularidad. 10 puntos para él.
4. “No hacer nuevos impuestos” es un eslogan popular, pero ha sido utilizado
por muchos candidatos, lo que disminuye su poder discriminador. 10 puntos para
“No hacer nuevos impuestos”.
5. Los votantes no confían en candidatos extremadamente liberales o
conservadores, por lo que los moderados tienen una importante ventaja. 25
puntos para los Moderados.
6. Consideraciones éticas están pesando mas en las elecciones, por lo que
aquellos candidatos que se han visto envueltos en escándalos verán afectada su
imagen pública. 20 puntos para aquellos libres de escándalo.
7. Como efecto de los medios audiovisuales, el carisma y la imagen telegénica
se han convertido en factores mas decisivos. 35 puntos para telegénicos.
8. Bolsas electorales mas abundantes permiten un mayor despliegue publicitario
en grandes distritos electorales. 25 puntos para la riqueza.
9. Los votantes tienen sus dudas en elegir candidatos poco experimentados a
altas posiciones, pero tampoco les agrada un candidato muy viejo que puede no
tener la energía o lucidez necesaria para todo el mandato. 20 puntos para
candidatos de edad mediana o maduros.

En una primera etapa consideramos sólo las primeras evaluaciones, que


corresponden estrictamente a datos concretos, lo que se muestra en la Tabla 9.5.
Hacemos luego dos preguntas, una concreta y otra difusa.

Tabla 9.5. Primera evaluación considerando sólo datos concretos de los candidatos.
CARACTERISTICA CANDIDATO APB
A B C D E F G H
Apoyo Sindical 0 0 0 0 1 0 0 0 m1=0,15
Afiliación Partidista m2=0,20
0 0 0 0 1 1 1 0
(Demócrata)
En ejercicio m3=0,10
1 0 0 0 0 0 0 0
(Incumbent)
Promesa m4=0,10
1 1 1 1 0 1 1 0
“No hacer nuevos Impuestos”
Moderado 0 1 1 0 1 0 1 1 m5=0,25
Sin Escándalo 0 1 1 1 1 1 1 1 m6=0,20

Q1: pregunta concreta: “¿Ganará la elección un demócrata moderado?”


Q1 está representado por el conjunto concreto (crisp set) {E, G}. La cota inferior Q1
es:
L(Q1) = m1 = 0,15, la cota superior es U(Q1) = 1 - m3 = 1 – 0,1 = 0,9.

Q2: pregunta difusa: “¿Ganará la elección un candidato Viejo y Carismático?”


Q2 está representado por el conjunto difuso:

Viejo ∩ Carismático =
={ 1| A; 1| E; 0,5| G}∩{ 0,8| A; 0,2| B; 1| C; 0,5| D; 1| E; 0,7| F; 0,9| G; 0,5|
H}
= {0,8| A; 1| E; 0,5| G}.

Cota inferior de Q2 es L(Q2) = m1 + (m3 × 0,8) = 0,15 + 0,08 = 0,23

Cota superior de Q2 es U(Q2) = m1 + m2 + (m3 × 0,8) + (m4 × 0,8) + m5 + m6 = 0,96


A continuación modificaremos la descripción original del conjunto de los
moderados, y de los sin escándalos, haciéndolos difusos. Un político puede ser, por
ejemplo, moderado o hasta conservador en su política fiscal, y mantener posturas
sociales liberales. También evaluaremos el grado de pertenencia de los candidatos a
los conjuntos difusos (previamente descritos) Gran_Presupuesto_de_Campaña y De
Edad Mediana a Maduro (x, 41, 45, 64, 67). Finalmente, modificamos los puntos para
que la suma de APBs de 1,0 (Ahora suman 180), cuyo resultado se puede observar
en la Tabla 9.6.

Tabla 9.6. Resultados de realizar las preguntas difusas y concretas, y de las modificaciones
Realizadas.
CARACTERISTICAS CANDIDATO APBs
A B C D E F G H
Apoyo Sindical 0 0 0 0 1 0 0 0 m1=0,0834
Afiliación Partidista 0 0 0 0 1 1 1 0 m2=0,1111
En Ejercicio 1 0 0 0 0 0 0 0 m3=0,0555
Promesa 1 1 1 1 0 1 1 0 m4=0,0555
“No hacer nuevos Impuestos”
Moderado 0 0,9 1 0 1 0,6 0,9 1 m5=0,1389
Sin Escándalos 0 1 1 1 0,5 1 1 1 m6=0,1111
Carisma/Telegénico 0,8 0,2 1 0,5 1 0,7 0,9 0,5 m7=0,1945
Dinero Abundante 1 0 0 0 1 0 0,66 0 m8=0,1389
Edad Mediana/Maduro 1 0 1 1 0,33 1 0 0,75 m9=0,1111

Considerando las mismas preguntas anteriores Q1 y Q2 . Q1={E,G}. Q2 = {0,8| A,


1| E, 0,5|G}.

Ahora:

Q1: Cota Inferior: L(Q1) = m1 = 0,0834.


Cota Superior: U(Q1) = m1+m2+m4+m5+m6+m7+m8+0,333m9
= 1 – (m3 + 0,666m9) = 0,8712.
Q2: Para calcular la cota Inferior, se debe calcular la necesidad de obtener un
candidato con las características mencionadas.

N(Q2 ) = 1− Π(~ Q2 ) = 1− max [(0,2 | A; 0 | E; 0,5 | G) ∩ (1| A; 1| E; 0,66 | G)]


= 1 − max[0,2;0;0,5] = 0,5

Luego, la cota inferior de Q2 es L(Q2) = m1+(1-0,2)m3+(1-0,5)m8 = 0,19725


Cota Superior: U(Q2) = m1+m2+0,8m3+0,8m4+m5+0,5m6+m7+m8= 1 –
(0,2m3+0,2m4+0,5m6) = 0,911

También podría gustarte