Está en la página 1de 22

Sistemas de razonamiento

probabilstico

Red de creencias: caractersticas
La red de creencias es un grafo dirigido y acclico en el cual:
1. Un conjunto de arcos dirigidos o flechas, conecta pares de
nodos.
2. Un conjunto de variables representa los nodos de la red.
3. Cada nodo tiene una tabla de probabilidad condicional que
cuantifica los efectos que los padres tienen sobre el nodo.

La principal ventaja del razonamiento probabilstico sobre el razo-
namiento lgico es que el primero permite tomar decisiones racio-
nales an en los casos en que no haya suficiente informacin para
probar que cualquier accin dada funcionar.


Ejemplo de Red de creencias
Mara llama Juan llama
Alarma
Hurto
Sismo
A
V
F
P(J)
0.05
0.90
A
V
F
P(M)
0.01
0.70
H
V
F
P(A)
0.94
0.95
S
V
V
V
F F
F
0.29
0.001
P(H)
0.001
P(S)
0.002

Representacin de la distribucin de probabilidad conjunta
Una red de creencias provee una descripcin completa del
dominio. Una entrada general es la probabilidad de una
conjuncin de asignaciones particulares a cada variable,
tal como P(X
1
= x
1
. ....

X
n
= x
n
). Usando la notacin
P(x
1
, x
2
, ...,x
n
) como abreviatura de esto, el valor de esta
entrada est dado por la siguiente frmula:
P(x
1
, x
2
, ...,x
n
) = H P(x
i
|Padres(X
i
)) [1]

Ejemplo: probabilidad de que la alarma haya sonado pero
que no hayan ocurrido hurto o sismo, y Juan y Mara
llamen:
P(J.M.A.H.S)=P(J|A) P(M|A)P(A|H.S)P (H)P(S)
= 0.90 * 0.70 * 0.001 * 0.999 * 0.998 = 0.00062
n
i = 1

Distribucin de probabilidad conjunta (cont.)
Probabilidad condicional por definicin:
P(x
1
, x
2
, ...,x
n
) = H P(x
i
| x
i-1
, ...,x
1
) [2]
Comparando con la ecuacin [1] vemos que la especifica-
cin es equivalente a la aseveracin general [3]
P(X
i
| X
i-1
,..., X
1
)=P(X
i
|Padres(X
i
)) siendo Padres(X
i
)_{x
i-1
, ...,x
1
}
La ecuacin anterior nos dice que la red de creencias es
una representacin correcta del dominio solo si cada nodo
es condicionalmente independiente de sus predecesores, en
el orden de los nodos, dados sus padres. Intuitivamente,
padres del nodo X
i
debera contener todos aquellos nodos
en X
1
, . . ., X
i-1
que influencian directamente a X
i
.
n
i=1

Procedimiento para la construccin de la red
1. Elegir el conjunto de variables X
i
relevantes que
describen el dominio.
2. Elegir un orden para las variables.
3. Mientras queden variables:
a) Tomar una variable X
i
y agregar un nodo a la red para
dicha variable.
b) Hacer que Padres(X
i
) sea un conjunto mnimo de
nodos ya existente en la red, tal que la propiedad de
independencia condicional [3] sea satisfecha.
c) Definir la tabla de probabilidad condicional para X
i
.

Representacin de tablas de probabilidad condicional
Nodo determinstico: su valor queda especificado exactamente por los
valores de sus padres, sin incertidumbre.
Las relaciones con incertidumbre pueden a veces ser caracterizadas por
las llamadas relaciones con ruido. El ejemplo estndar es el llamado
OR-ruidoso que es una generalizacin del OR lgico.
En lgica proposicional, podamos decir Fiebre es verdadero si y solo
si Resfro, Gripe o Malaria es verdadero. El modelo OR-ruidoso agrega
alguna incertidumbre a este enfoque estrictamente lgico.
El modelo asume tres cosas:
Cada causa tiene una chance independiente de causar el efecto.
Todas las causas posibles estn listadas.
Cualquier cosa que inhibe, por ej. a Gripe, de causar Fiebre, es inde-
pendiente de lo que inhiba a Resfro de causar Fiebre. Estos inhibid. no
se representan como nodos sino que se resumen comoparm.de ruido.
Representacin de tablas de probabilidad condicional
(continuacin)







F
F
F
F
V
V
V
V
`
Parmetros
de ruido
F
F
F
F
F
F
F
F
V
V
V
V
V
V
V
V
0.0
0.9
0.98
0.94
0.8
0.88
0.4
0.988
P(Fiebre) Malaria Gripe Resfro P(Fiebre)
1.0
0.1
0.2
0.6
0.02
0.06
0.12
0.012

)

Relaciones de independencia condicional en
redes de creencias
Separacin dependiente de la direccin o d-separacin:
Dada una red, es posible determinar si un conjunto de nodos X es
independiente de otro conjunto Y, dado un conjunto de nodos
evidencia E.
Si todo camino no dirigido desde un nodo en X a un nodo en Y es
d-separado por E, luego X e Y son condicionalm. independ., dada E.
Un conjunto de nodos E d-separa dos conjuntos de nodos X e Y si
cada camino no dirigido desde un nodo en X hasta un nodo en Y est
bloqueado dado E. Un camino est bloqueado dado un conjunto de
nodos E si hay un nodo Z en el camino para el cual se cumple una de
las tres condiciones siguientes:
1 Z est en E y Z tiene una flecha ingresando y otra saliendo.
2 Z est en E y tiene ambas flechas del camino hacia afuera.
3 Ni Z ni ningn descend.de Z est en E,y ambas flecha apuntan a Z.
Tres formas en que un camino desde X hasta Y puede ser bloqueado,
dada la evidencia E.
Ejemplo:
Relaciones de independencia condicional
en redes de creencias (continuacin)
Z
Z
Z
E Y X
Batera
Radio Ignicin Nafta
Arranca
Se mueve
I nferencia en redes de creencias
La tarea bsica de cualquier sistema de inferencia probabilstico es
computar la distribucin de probabilidad posterior de un conjunto de
variables de Query, dados los valores exactos de algunas variables de
evidencia: P(Query|Evidencia), Ej. P(Hurto|JuanLlama)
En general, un agente toma valores para variables de evidencia, de
sus percepciones (o de otro razonamiento), y pregunta sobre valores
posibles de otras variables de modo que puede decidir qu acciones
tomar.
Las redes de creencias pueden realizar cuatro tipos de inferencias:
- Inferencias diagnsticas (de efectos a causas)
- Inferencias causales (de causas a efectos)
- Inferencias intercausales (entre causas de un efecto comn)
- Inferencias mezcladas (combinando dos o ms de las anteriores)
Posibles usos de las redes de creencias
Adems de permitir calcular la creencia en variables de Query,
dados los valores definidos para variables de evidencia, las redes de
creencias pueden ser usadas para lo siguiente:
Tomar decisiones basadas en probabilidades en la red y en las uti-
lidades del agente.
Decidir qu variables de evidencia adicionales deberan ser obser-
vadas para ganar informacin til.
Realizar anlisis de sensibilidad para entender qu aspectos del
modelo tienen el mayor impacto sobre las probabilidades de las va-
riables de Query.
Explicar al usuario los resultados de la inferencia probabilstica.
I nferencia en redes de creencias con mltiples
conexiones
Hay tres clases bsicas de algoritmos para evaluar redes de
conexiones mltiples:
Agrupamiento (clustering), mtodos que transforman la red en un
polytree equivalente probabilstico (pero diferente topolgicamen-
te), uniendo nodos ofensivos.
Condicionamiento por conjunto de corte, mtodos que realizan la
transformacin dando valores concretos a las variables, y luego eva-
luando un polytree para cada particularizacin posible.
Simulacin estocstica, mtodos que usan la red para generar un
gran nmero de modelos concretos del dominio que son consisten-
tes con la distribucin de la red.
Red con conexiones mltiples con tablas de
probabilidad condicional
N
V
F
P(Ll)
Lluvia
0.20
0.80
Regador
Nublado
P(N) = 0.5
Pasto
Hmedo
N
V
F
P(R)
0.50
0.10
V
V
F
V
V
F
F
F
0.99
0.90
0.90
0.00
P(H) R Ll
Equivalente de la red con conexiones mltiples
usando agrupamiento (clustering)
V
V
F
V
V
F
F
F
0.99
0.90
0.90
0.00
P(H) R + Ll
Regador + Lluvia

Nublado
P(N) = 0.5
Pasto Hmedo
N
F
P(R +Ll = x)
0.08 0.02 0.72 0.18
0.10 0.40 0.10 0.40
VV VF FV FF
V
Mtodo de condicionamiento por conjunto de corte
Regador
Lluvia
+ Nublado
Pasto Hmedo
+ Nublado
Regador
Lluvia
- Nublado
Pasto Hmedo
- Nublado
Transforma la red en varios polytrees ms simples. Cada red simple
tiene una o mas variables particularizadas a un valor definido. El conj.
de variables que puede ser particularizado se llama conjunto de corte.
Nota. Polytree: red simplemente conectada, en tal red hay como mxi-
mo un camino no dirigido entre dos nodos cualesquiera.
Mtodo de simulacin estocstica
Se corren simulaciones repetidas del mundo descripto por
la red de creencia, y se estima la probabilidad en que es-
tamos interesados, contando las frecuencias con las cuales
los eventos relevantes ocurren. La mayor dificultad con es-
te mtodo es que toma un largo tiempo obtener probabili-
dades precisas para eventos poco probables.
I ngeniera del conocimiento para razonamiento
con incertidumbre
Decidir sobre qu hablar. Es importante decidir qu
factores sern modelados, y cules sern resumidos por
enunciados probabilsticos.
Decidir sobre un vocabulario de variables al azar.
Codificar conocimiento general acerca de la dependencia
entre variables.
Codificar una descripcin del caso particular especfico
del problema.
Presentar Queries al procedimiento de inferencia y obte-
ner respuestas.
Otros enfoques de razonamiento con incertidumbre
Razonamiento por omisin (default)
Trata a las conclusiones como crebles hasta que se haya encontra-
do una razon mejor para creer en algo ms. Exhibe no monotonici-
dad porque el conjunto de creencias no crece monotnicamente a
medida que se obtiene nueva evidencia. Estos tipos de sistemas
comparten un cierto nmero de temas problemticos:
Cul es el status semntico de las reglas por omisin? Cul es el conjunto
adecuado de reglas por omisin que se debe tener?
Qu ocurre cuando la evidencia coincide con las premisas de dos reglas por
omisin con conclusiones en conflicto?
Algunas veces un sistema puede llevar a un nmero de conclusiones basndose
en una creencia que es retractada ms tarde. Cmo puede el sistema hacer un
seguimiento de qu conclusiones necesitan ser retractadas?
Cmo las creencias que tienen status por omisin pueden ser usadas para
tomar decisiones?
Mtodos basados en reglas para el razonamiento
con incertidumbre
Adems de la monotonicidad, los sistemas de razonamiento lgico
tienen otras tres propiedades que los razonadores probabilsticos no
poseen:
Carcter local: A B podemos conclur B dada A sin preocupar-
nos acerca de cualquier otra regla.
Desapego: Una vez que se ha encontrado una prueba lgica para
una proposicin B, esta puede ser usada sin importar cmo fue
derivada.
Funcionalidad de la verdad: En lgica,la verdad de sentencias com-
plejas se puede computar a partir de la verdad de sus componentes.
Las propiedades antes mencionadas no son apropiadas para el
razonamiento con incertidumbre.
Mtodos basados en reglas para el razonamiento
con incertidumbre (continuacin)
Ejemplo: funcionalidad de la verdad. Los eventos H
1
, H
2
y
T
1
tienen la misma probabilidad 0.5, entonces un sistema
verdad-funcional debe asignar la misma creencia a la dis-
yuncin de cualquier par de ellos. Pero, podemos ver que
la probabilidad de la disyuncin depende de los eventos, y
no de sus probabilidades:
P(A) P(B) P(A v B)
P(H
1
) = 0.5 P(T
1
) = 0.5
P(H
2
) = 0.5
P(H
1
) = 0.5 P(H
1
v H
1
) = 0.5
P(H
1
v T
1
) = 1.0
P(H
1
v H
2
) = 0.75
Teora Dempster - Shafer
Trata la distincin entre incertidumbre e ignorancia. En
vez de computar la probabilidad de una proposicin, com-
puta la probabilidad de que la evidencia soporte la propo-
sicin.
Una interpretacin de esta teora es que define un interva-
lo de probabilidad: en el ejemplo de R&N el intervalo para
Cara es [0,1] antes del testimonio del experto,y [0.45,0.55]
despus.