Está en la página 1de 30

UNIDAD III.

Representación del Conocimiento:


Modelos Estructurados.

Ing. Vinicio Ramos Valencia


vi_ramos@espoch.edu.ec
0984421066
Temas:

 Teoría Bayesiana.
 Teoría de la Confirmación.
Teoría Bayesiana:

Parte de las leyes probabilísticas:


p(~A) = 1 - p(A)
p(A v B) = p(A) + p(B) - p(A ^ B)
p(A ^ B) = p(A) * p(B) si A y B son independientes
p(h/e) = p(e ^ h) / p(e)

En lo anterior se incluyen los conceptos: p(h) - probabilidad a priori


p(h/e) - probabilidad a posteriori

El objetivo en toda inferencia es: dado p(e) y p(h) obtener p(h/e). Para ello se supone la BC
compuesta por reglas del tipo:
e -> h /p(h/e)
y la BD compuesta por hechos del tipo:
e /p(e) y h /p(h)
Teoría Bayesiana:

Con esto, la máquina de inferencias debe revisar la BD para actualizar en los hechos
la probabilidad a priori por la posteriori. Según lo anterior se precisa definir p(h/e), lo
cual es muy difícil de obtener directamente.

La solución a esto se tiene en la regla de Bayes:

p(e/h) * p(h)
p(h/e) = ---------------------------------
p(e/h) * p(h) + p(e/~h) * p(~h)

siendo:

p(e/h) - la posibilidad de e / h.
Ejemplo
h - tener una enfermedad
e - ser positivo determinado análisis

p(e/h) = 0.98 - análisis positivo / estar enfermo


p(e/~h) = 0.05 - análisis positivo / estar sano
p(h) = 0.01 - enfermos / la población

p(h/e) = (0.98 * 0.01) / (0.98 * 0.01 + 0.05 * 0.99) = 0.165

¿Esa probabilidad es pequeña o grande?. R/ No importa el valor absoluto (en general). Lo que importa es
cómo cambia p(h) por p(h/e).

En lo anterior se han considerado los eventos: h y ~h, pero pueden ser:

h1, ..., hn / e -> hi, i = 1 a n

En este caso se exige que:


p(hi ^ hj) = 0 para todo i,j, i <> j y p(h1)+...+p(hn) = 1

O sea, que sean excluyentes y exhaustivas.


Ejemplos

En la sala de pediatría de un hospital, el 60% de los pacientes son niñas. De los


niños el 35% son menores de 24 meses. El 20% de las niñas tienen menos de 24
meses. Un pediatra que ingresa a la sala selecciona un infante al azar.
a. Determine el valor de la probabilidad de que sea menor de 24 meses.
b. Si el infante resulta ser menor de 24 meses. Determine la probabilidad que sea
una niña.
SOLUCIÓN:
Se definen los sucesos:

 Suceso H: seleccionar una niña.


 Suceso V: seleccionar un niño.
 Suceso M: infante menor de 24 meses.

En los ejercicios de probabilidad total y teorema de bayes, es importante identificar los sucesos que forman
la población y cuál es la característica que tienen en común dichos sucesos. Estos serán los sucesos
condicionados.

a. En este caso, la población es de los infantes. Y la característica en común es que sean menores de 24
meses. Por lo tanto, la probabilidad de seleccionar un infante menor de 24 meses es un ejemplo de
probabilidad total. Su probabilidad será:


 b. Para identificar cuando en un ejercicio se hace referencia al teorema
de bayes, hay que partir de reconocer esta es una probabilidad
condicionada y que la característica común de los sucesos
condicionantes ya ha ocurrido. Entonces, la probabilidad de que sea niña
una infante menor de 24 meses será:

á:
Ejemplos
 Un médico cirujano se especializa en cirugías estéticas. Entre sus pacientes, el
20% se realizan correcciones faciales, un 35% implantes mamarios y el restante
en otras cirugías correctivas. Se sabe además, que son mujeres(entre 20 y 25
años) el 25% de los que se realizan correcciones faciales, 15% implantes
mamarios y 40% otras cirugías correctivas. Si se selecciona un paciente al azar,
determine:
a. Determine la probabilidad de que sea de género femenino (20 y 25 años)
b. Si resulta que es de género femenino (20 y 25 años), determine la probabilidad que
se haya realizado una cirugía de implantes mamarios.

 Un Doctor dispone de tres equipos electrónicos para realizar ecosonogramas.


El uso que le da a cada equipo es de 25% al primero, 35% el segundo en y 40%
el tercero. Se sabe que los aparatos tienen probabilidades de error de 1%, 2%
y 3% respectivamente. Un paciente busca el resultado de una ecografía y
observa que tiene un error. Determine la probabilidad de que se ha usado el
primer aparato.
Ejemplos
Una fábrica de enlatados produce 5000 envases diarios. La máquina A
produce 3000 de estos envases, de los que el 2% son defectuosos y la
máquina B produce los 2000 restantes de los que se sabe que el 4% son
defectuosos.

Determinar:

a. La probabilidad de que un envase elegido al azar sea defectuoso


b. Si el envase seleccionado es defectuoso qué probabilidad existe de que
proceda de la Maquina A?. y de la máquina B?.
Teoría de la Confirmación:

Las deficiencias fundamentales de la teoría de


Bayes es la necesidad de que las hipótesis de
igual evidencia sean entre sí exhaustivas y
excluyentes y los valores probabilísticos en sí al
medir de forma absoluta los eventos (¿Qué
diferencia hay en cambiar 0.1 por 0.15 o cambiar
0.2 por 0.25?).

Para resolver la segunda deficiencia, es que se


introduce esta teoría
(Shortliffe y Buchanan en MYCIN)

MC(h/e) - incremento de la credibilidad de h/e


MI(h/e) - incremento de la incredibilidad de h/e

CF(h/e) = MC(h/e) - MI(h/e) valor de incertidumbre


utilizado
Teoría de la Confirmación:

Interpretación relativa de CF(h/e):


Valor
1 p(h/e) = 1 Absolutamente cierto
MC(h/e) p(h/e) > p(h)
0 p(h/e) = p(h) Desconocido
-MI(h/e) p(h/e) < p(h)
-1 p(h/e) = 0 Absolutamente falso

Lógica de la máquina de inferencias: Las reglas de producción se tienen como:

e - > h /CF(h/e)

y la BD vacía o no pues los CF a priori siempre son ceros (como "e" aún no se verifica entonces
p(h/e) = p(h)). El propósito es obtener el CF de “h” dado que “e” se cumpla o no.
Teoría de la Confirmación:
Para negar algo no puede usarse la fórmula de la negación probabilística, por no ser probabilidades. Para ello se utiliza:
CF(~h/e) = -CF(h/e) (certezas de “h” opuestas son simétricamente opuestas y no complementarias).
Suponer el ejemplo del inicio en el que:

h - tener una enfermedad


e - ser positivo determinado análisis

p(e/h) = 0.98 - análisis positivo / estar enfermo


p(e/~h) = 0.05 - análisis positivo / estar sano
p(h) = 0.01 - enfermos / la población

p(h/e) = 0.165 (calculado anteriormente)

En una BC con valores puramente probabilísticos se tendría:

BR: e -> h /((p(e/h), p(e/~h)) = (0.98, 0.05) (Si T. Bayes puro)


BD: h /p(h) = 0.01

Si se cumple la evidencia "e", entonces se infiere el cambio de p(h) de 0.01 a 0.165.


Teoría de la Confirmación:

En una BC con valores tipo MYCIN se tendría:

BR: e -> h /CF(h/e)


BD: vacía (o lo que es lo mismo h/CF = 0, pues no existe nada que aumente o disminuya lo que habitualmente se
conoce de h.

Esto exige tener calculado previamente el valor de CF(h/e) el cual, como p(h/e) > p(h), se define como:
CF(h/e) = MC(h/e) = (p(h/e)-p(h))/(1-p(h)) = (0.165 - 0.01)/(1 - 0.01) = 0.155

Si se cumple la evidencia "e", entonces se infiere directamente el valor de 0.155. Este valor nos indica que, en una
escala de 100%, al cumplirse "e" aumenta la certeza del cumplimiento de "h" en un 15.5% (sean cual sean las
probabilidades involucradas).

¿Cuál sería la certeza de CF(~h/e) ? R/ -0.155

Valor de la probabilidad dado un valor de certeza:

p(h/e) = p(h) + CF(h/e)*(1-p(h))


Teoría de la Confirmación:

Propagación de Certezas (CONTRIBUCION):

En lo visto hasta aquí se ha supuesto que una hipótesis se infiere como consecuencia directa
de una evidencia conocida o no desde el inicio del proceso inferencial. Sin embargo, es muy
frecuente en los SE que la evidencia de una hipótesis dependa de otras hipótesis inferidas. O
sea:
e -> h1 y h1 -> h2

Supongamos que se tenga lo anterior en la BR con las siguientes certezas:

BR: e -> h1 /CF(h1/e) = 0.6


h1 -> h2 /CF(h2/h1) = 0.8

¿Qué interpretación tiene CF(h1/e)?. ¿Qué interpretación tiene CF(h2/h1)?


Teoría de la Confirmación:

R/ Aumenta en un 80% el cumplimiento de “h2” si se cumple “h1”, pero si se cumple de forma absoluta.

Pero en este caso “h1” se cumple parcialmente. Es lógico pensar que el grado de cumplimiento del antecedente
repercute en la certeza obtenida con la inferencia.

Para resolver lo anterior se define la siguiente función de contribución:

Resolviendo el problema planteado:

CF(h2/e) = 0.8 * 0.6 = 0.48

O sea, la certeza del cumplimiento de “h2” aumenta en un 48% si se cumple “e”.

En el problema anterior se ha supuesto que "e" es un dato de entrada y que se verifica de forma absoluta. ¿En la
práctica tiene que cumplirse siempre esto?
Teoría de la Confirmación:
Por ejemplo, supongamos que en el primer problema el análisis positivo se logre determinar a través de un equipo
no totalmente confiable o por una persona poco experimentada.

¿Puede afirmarse en este caso que la evidencia del análisis es absoluta y que se tiene la enfermedad con igual
certeza?

Si en la BR se tuviera: e -> h /CF(h/e)


se pudiera suponer una regla ficticia del tipo: E -> e /CF(e/E)
siendo CF(e/E) el grado de cumplimiento de la evidencia.

En este caso, "E" se considera la evidencia total, la cual representa el grado de confiabilidad de la fuente de
información.
Si se tuvieran tales valores para cada evidencia primaria, entonces la función de contribución se redefiniría como
sigue:

Utilizándose esta función para propagar la incertidumbre desde la evidencia primaria hasta la hipótesis final.
¿Cómo determinar CF(e/E)?

La determinación de este parámetro depende del significado de "e" y de las causas de su incertidumbre. En algunas
ocasiones este valor lo ofrece el usuario al considerar por apreciación, en una escala de -1 a 1, el grado de cumplimiento de
la evidencia. En otras ocasiones tal valor se define a partir de varias constantes o de una tabla de valores prefijados tras un
estudio preliminar del fenómeno. También pudiera definirse una función dependiente de otros parámetros, etc. En este curso
consideraremos que ese valor está dado de alguna forma, dejando para postgrados el estudio de este fenómeno.

Ejemplo: Suponer una BR como sigue:

A -> B /CF(B/A) = -0.6


~B -> C /CF(C/~B) = -0.9

Si se conoce la certeza de A como CF(A/E) = 0.8, ¿Cuál es la certeza de CF(~C/E)?

R/ CF(B/E) = CF(B/A) * CF(A/E) = -0.6 * 0.8 = -0.48


CF(~B/E) = - CF(B/E) = 0.48
CF(C/E) = CF(C/~B) * CF(~B/E) = -0.9 * 0.48 = -0.432
CF(~C/E) = - CF(C/E) = 0.432

O sea, con las evidencias que existen aumenta la creencia del no cumplimiento de C en un 43.2%.
Teoría de la Confirmación:

1. Fórmulas:

MC(h/e) - incremento de la credibilidad de h/e


MI(h/e) - incremento de la incredibilidad de h/e

2. Valor de Certeza:

CF(h/e) = MC(h/e) - MI(h/e)

3. Lógica de la máquina de inferencias:

- Base de Reglas: e - > h /CF(h/e)


- Base de Datos vacía o no pues los CF a priori siempre son ceros.
- Objetivo: Obtener el CF de “h” dado que “e” se cumpla o no.
Teoría de la Confirmación:

4. Negación:
CF(~h/e) = -CF(h/e)

5. Propagación de Certeza (Contribución):

6. Antecedentes Compuestos:

En la clase anterior se han supuesto reglas del tipo: A -> C. Sin embargo, es conocido que
estas pueden tener como antecedente una conjunción de términos afirmados o negados:
[A1,...,An] => C.

En el sistema MYCIN se utilizó como conjunción la siguiente:


CF(h1 & h2 / E) = Min(CF(h1/E), CF(h2/E))

Para la disyunción la siguiente: CF(h1 v h2 / E) = Max(CF(h1/E), CF(h2/E))


Teoría de la Confirmación:

Ejemplo:

BD = [~a / CF=0.5, b / CF=0.3]

BR = R1 [~a => c / CF=0.9]


R2 [c & b => d / CF=0.8]

¿Con qué certeza se infiere d?

R/:
CF(~a/E) = 0.5
CF(c/~a) = 0.9
CF(b/E) = 0.3
CF(d/c&b) = 0.8

CF(c/E) = CF(c/~a) * CF(~a/E) = 0.9 * 0.5 = 0.45

CF(c&b/E) = Min(CF(c/E), CF(b/E)) = Min(0.45, 0.3) = 0.3

CF(d/E) = CF(d/c&b) * CF(c&b/E) = 0.8 * 0.3 = 0.24


Teoría de la Confirmación:

7. Acumulación de Evidencias:

Aún nos queda otro tipo de situación en una BC:

e1 -> h /CF(h/e1)
e2 -> h /CF(h/e2)

Ejemplo:
h - Hay ladrones.
e1 - Alarma láser.
e2 - Alarma mecánica.

CF(h/e1) = 0.9
CF(h/e2) = 0.5

La alarma mecánica es totalmente confiable, o sea, CF(e2/E) = 1.0. Pero la láser no es segura, por lo que se asume CF(e1/E) = 0.6.
Teoría de la Confirmación:

Por lo conocido se sabe que:

CF(h/E:e1) = CF(h/e1) * CF(e1/E) = 0.9 * 0.6 = 0.54


CF(h/E:e2) = CF(h/e2) * CF(e2/E) = 0.5 * 1.0 = 0.5

¿Cuál de las dos certezas se consideran?


¿Es una de ellas o es otro valor que las incluye?

Es lógico suponer que no es lo mismo afirmar que hay ladrón si suena una sola de las
alarmas a si suenan las dos simultáneamente. Este fenómeno suele denominarse
"acumulación de las evidencias".
Teoría de la Confirmación:

En esta teoría la acumulación de evidencias se resuelve como:

CF1 + CF2 - CF1 * CF2 si CF1, CF2 > 0

CF1 + CF2 + CF1 * CF2 si CF1, CF2 < 0


CF(h/E:e1&e2) =
CF1 + CF2
--------------------- otro caso
1 - Min(CF1, CF2)

donde:
CF1 = CF(h/E:e1)
CF2 = CF(h/E:e2)

¿Cuál sería la solución en el ejemplo visto?

R/
CF(h/E:e1&e2) = 0.54 + 0.5 - 0.54 * 0.5 = 1.04 - 0.27 = 0.77

(((*** Observar como aumenta la certeza acumulada ***)))


Teoría de la Confirmación:
8. Características de la Teoría de la Confirmación (MYCIN):

 Bien argumentada.

 Es automatizable.

 Simple y comprensible por los usuarios y expertos.

 La BC debe validarse verificando que cumple lo siguiente:

Si e1 & ... & en -> h entonces los ei deben ser independientes bajo h.

 Una afirmación con CF = 1 sobre una hipótesis exige un CF = -1 sobre toda


hipótesis excluyente con ella. O sea:

e -> h1 y e -> h2

Si p(h1 & h2 /e) = 0 y CF(h1/e) = 1, entonces CF(h2/e) = -1

 Los factores de certeza positivos sobre hipótesis mutuamente excluyentes


suman a lo sumo uno. O sea:

e -> hi, i = 1,...,n


Si p(hi & hj /e) = 0 para i,j = 1,...,n e i <> j y CF(hi/e) > 0 para toda i, entonces
CF(h1/e)+...+CF(hn/e) <= 1
Ejemplo de aplicación (Razonamiento Aproximado):

En una empresa agrícola se quiere conocer si ciertas plantas presentan o no una enfermedad determinada. Para ello
consultaron un informe técnico en el que se expone el estudio de dos reactivos con los siguientes resultados:
 De 1000 plantas enfermas, 700 reaccionaron con el primero y 900 con el segundo.
 De 1000 plantas sanas, 10 reaccionaron con el primero y 20 reaccionaron con el segundo.

La empresa conoce que históricamente se ha tenido en sus áreas de cultivo una probabilidad de 0.01 de presentar dicha
enfermedad y de que reaccionen a ambos reactivos, creyéndose casual esa coincidencia.

a. Defina la base de conocimientos según el modelo MYCIN (teoría de la confirmación).


b. ¿Qué se decide sobre una planta que reacciona positivamente al segundo reactivo y que se estima que también
reaccionaría positivamente al primero con una certeza de 0.5 en una escala de [-1,1]?
c. ¿Cuál es la probabilidad a posteriori asociada con la respuesta anterior?
d. Reanalice las soluciones anteriores si no se dispone del primer reactivo pero se cree que toda planta con la
característica C reacciona positivamente a ese reactivo. Para ello se ha determinado que:
 De 1000 plantas que reaccionan positivamente, 990 poseen la característica C.
 De 1000 plantas que reacciona negativamente, 30 poseen la característica C.
 De 1000 plantas, 10 presentan la característica C.
 De la planta se cree con un 60% de seguridad que posee la característica C.
Ejemplo:

P(r1/h) = 0.01
a) P(r2/h) = 0.02
P(h) = 0.01
P(h) = 0.99
r1: Reaccionan al reactivo 1.
p(r1/h) * p(h)
r2: Reaccionan al reactivo 2. p(h/r1) = --------------------------------------- = 0.4
h: Planta enferma. p(r1/h) * p(h) + p(r1/~h) * p(~h)

p(r2/h) * p(h)
p(h/r2) = --------------------------------------- = 0.3
Base de Reglas: p(r2/h) * p(h) + p(r2/~h) * p(~h)

r1  h / CF(h/r1) CF(h/r1) = MC(h/r1) – MI(h/r1)


p(h/r1) - p(h)
r2  h / CF(h/r2) CF(h/r1) = MC(h/r1) = ---------------- = 0.39
1 - p(h)

CF(h/r2) = MC(h/r2) – MI(h/r2)


p(h/r2) - p(h)
Datos: CF(h/r2) = MC(h/r2) = ---------------- = 0.29
1 - p(h)

P(r1/h) = 0.7 Base de Reglas:

P(r2/h) = 0.9 r1  h / CF(h/r1) = 0.39


r2  h / CF(h/r2) = 0.29
Ejemplo:

b) c)
Datos:
Ecuación para el cálculo de la probabilidad dado el
valor de la certeza:
CF(r2/E) = 1.0
CF(r1/E) = 0.5 P(h/E) = P(h) + CF(h/E) * (1 - P(h)) = 0.429

CF(h/E:r1) = CF(h/r1) * CF(r1/E) = 0.195 = CF1 Este resultado se obtiene de la fórmula para el cálculo
de CF(h/E).
CF(h/E:r2) = CF(h/r2) * CF(r2/E) = 0.29 = CF2

CF(h/E:r1&r2) = CF1 + CF2 – CF1 * CF2 = 0.428


Ejemplo

 Resolver el literal d) del problema planteado.


GRACIAS!!!

También podría gustarte