Está en la página 1de 15

Universidad Tecnológica de Panamá

Facultad de Ingeniería de Sistemas Computacionales


Licenciatura en Ingeniería de Sistemas y Computación

Sistemas Dinámicos

Laboratorio#5

Estudiante:
David Soriano 8-907-1260

Facilitador:
Prof. Tuñon Modaldo

Grupo:
IL143

I Semestre ,2019
Contenido
SEDFE: Un Sistema Experto para el Diagnóstico Fitosanitario del .............................................................. 1

Espárrago usando Redes Bayesianas .......................................................................................................... 1

Planteamiento del problema .................................................................................................................. 1

Red Bayesiana ......................................................................................................................................... 2

Sensibilidad y especificidad .................................................................................................................... 3

Inferencia de la Red Bayesiana ............................................................................................................... 4

Análisis espacial de la mortalidad en áreas geográficas pequeñas. El enfoque bayesiano ........................ 7

Planteamiento del problema .................................................................................................................. 7

Métodos bayesianos ................................................................................................................................... 9

Conclusión .................................................................................................... Error! Bookmark not defined.

Bibliografía ................................................................................................................................................ 13
SEDFE: Un Sistema Experto para el Diagnóstico Fitosanitario del

Espárrago usando Redes Bayesianas

Planteamiento del problema

La producción de cultivos agroindustriales se ha visto siempre diezmada por el ataque


de plagas o el padecimiento de enfermedades en buena parte de toda la producción del
cultivo agrícola, conllevando esto siempre a grandes pérdidas económicas en las
empresas agroindustriales, en donde se pierden grandes áreas de cultivos azotadas por
alguna anomalía que en muchos casos pudo haber sido evitada si se detectaba con
anterioridad. El diagnóstico de enfermedades o plagas se lleva a cabo a través del
monitoreo de las plantaciones de cultivo, en donde el objetivo es detectar anomalías
presentes sobre las plantas, como por ejemplo, tallos secos, presencia de pústulas en
alguna parte de la planta, presencia de insectos nocivos, entre otros. Así, teniendo un
conjunto de síntomas visibles dentro del ambiente o campo de cultivo se puede realizar
un diagnóstico que permitirá tomar las medidas necesarias y adecuadas para minimizar
el daño sobre los cultivos.

En este contexto el trabajo aborda un problema específico, enfocándose en el


diagnóstico de enfermedades y plagas para el producto del espárrago. El espárrago es
un producto agroindustrial de gran consumo, y así como otros productos agroindustriales,
tienen un tratamiento especial y adecuado para lograr su cosecha. Este producto resulta
normalmente afectado por muchas enfermedades como la roya, estemfiliosis, etc.; y
plagas como el gusano de alambre, entre otros. Esto depende muchas veces de las
condiciones ambientales y tipo de suelo del lugar de cultivo. Dado que las plagas y
enfermedades se presentan en función de las características del lugar de cultivo,
tenemos que no todos los lugares de cultivos tendrán las mismas enfermedades o
plagas, o al menos no con el mismo nivel de presencia.

Por ello, una de las soluciones a dicho problema fue establecer un modelo probabilístico,
en donde todas las enfermedades y síntomas tenían inicialmente un valor 3 de
probabilidad que representaba el nivel de presencia en el entorno, llamada prevalencia.
En este otro enfoque, si bien es cierto se establecían reglas lógicas para relacionar los
síntomas con enfermedades, éstas no obedecían al modelo de inferencia de la lógica de
primer orden, dado que no respetaban las reglas de inferencia, sino que las
quebrantaban. A pesar de ello, los resultados fueron mayoritariamente satisfactorios
dado que las prevalencias permitían adaptar el modelo del conocimiento a un entorno
específico. La red Bayesiana es un modelo probabilístico basado en el teorema de Bayes
y que establece una relación entre síntomas y enfermedades mediante la construcción

1
de la base de conocimiento en un grafo, en donde los nodos padres representan a los
efectos y los nodos hijos a las causas, teniendo así, un conjunto de reglas implícitamente
representando el modo causa-efecto, de nodo hijo a nodo padre. Este tipo de grafo se le
denomina red de diagnóstico, puesto que posibilita mantener información que es
necesaria para lograr efectuar una inferencia sobre el grafo y obtener un diagnóstico
resultante. Si bien el modelo probabilístico es la parte principal del sistema experto
presentado, es necesario realizar un proceso previo a su construcción, la selección
adecuada de un conjunto de síntomas para cada enfermedad y plaga del espárrago.
Quizá, parecería lógico establecer como un conjunto de síntomas para una enfermedad
determinada, a todos los síntomas que se hayan presentado cuando ocurrió una
enfermedad en el pasado. Sin embargo, realizar la selección de este modo no sería lo
adecuado, por la existencia de dos factores: la sensibilidad y la especificidad, que serán
explicadas más adelante. Luego de la selección de los síntomas viene la construcción
del grafo, considerando la representación de una red de diagnóstico. Posteriormente el
motor de inferencia del sistema experto realiza su trabajo de inferir un diagnóstico, para
lo cual hace uso del algoritmo de paso de mensajes propuesto por Kim .

Definición de los eventos

Red Bayesiana

La red Bayesiana de tipo causal , es el conjunto de síntomas y causas (enfermedades)


representadas por un nodo, en donde el sentido de las aristas denota una relación directa
entre efecto-causa. En la figura 1 podemos observar una red de tipo causal, en donde la
evidencia proviene normalmente de los nodos síntomas, y en donde se trata de
determinar cuáles enfermedades representan mejor a los síntomas observados.

2
En la figura 1 por razones de simplicidad usaremos variables para denotar a alguna
enfermedad o síntoma. El nodo “R” representa a la enfermedad del espárrago conocida
como Roya, mientras que los síntomas Tallo Seco y Tallo con Pústulas Rojizas son
representados como “TS” y “TPR” respectivamente. En la figura 1 se observa que “TS” y
“TPR” han sido evidenciadas, confirmando la presencia de Tallo Seco P(TS=1) y la
ausencia de Tallo con Pústulas Rojizas P(TPR=0). Ahora podemos estimar la
probabilidad de que aparezca Roya dada las dos evidencias anteriores, como se expresa
en la consulta: P(R=1 | TS=1, TPR=0). La notación que se presenta en este informe
acerca de las variables o nodos, como en la figura 1 y tablas de resultados.

Sensibilidad y especificidad

La sensibilidad es la probabilidad que indica una correlación entre la aparición de la


enfermedad y la aparición del síntoma. La especificidad en cambio es la probabilidad de
no tener el síntoma, cuando no está la enfermedad presente. Ambos valores son
indispensables para poder representar claramente una enfermedad. De esta manera, en
la figura 2 se muestra los niveles de especificidad y sensibilidad de lo síntomas de la
Estemfiliosis del espárrago que veremos más adelante en la sección de experimentos.

Dicho de otro modo, la sensibilidad es un valor cuantitativo, entre cero y uno, que explica
el nivel de relación entre aparición-síntoma aparición-enfermedad, es decir, cuanta
probabilidad hay de que, al aparecer dicho síntoma, aparecerá la enfermedad. Por otro
lado, la especificidad es un valor cuantitativo, entre cero y uno, que explica el nivel de
relación entre ausencia-síntoma ausencia-enfermedad, indicando la probabilidad de que,
al no existir el síntoma, no aparezca la enfermedad. Para realizar una selección
adecuada de síntomas que expliquen acertadamente la aparición de una enfermedad,
es necesario seleccionar síntomas cuya relación de sensibilidad y especificidad con

3
respecto a una enfermedad o plaga sea elevada. Tómese en cuenta que mientras más
alta sea la relación, hay mayor seguridad de que los resultados serán idóneos.
Considerar niveles de sensibilidad y especificidad por debajo de 70% no es muy
recomendable.

Inferencia de la Red Bayesiana

Como hemos mencionado, el proceso de inferencia será basado en el algoritmo de paso


de mensajes de Kim y Pearl , explicado también en , el cual, es similar al de inferencia
por enumeración, sin embargo considera la comunicación bidireccional, es decir de
padres a hijos y viceversa, lo que permite establecer razonamiento de diagnóstico como
de predicción. Por otro lado, el algoritmo almacena valores parciales en base a los
mensajes π y λ , recibidos de los nodos padres e hijos respectivamente 5 . Esto permite
realizar un precálculo de probabilidades, lo que permite ahorrar tiempo para la siguiente
vez en el que se tenga que realizar esta tarea. A continuación, describiremos los valores
usados en el algoritmo de inferencia, teniendo en cuenta que un nodo actual X tiene un
conjunto de padres U y un conjunto de hijos Y.

Resolución

Tabla 1: Se muestra la prevalencia de las enfermedades consideradas para el entorno A


Como se muestra en la figura 3, hay ciertos síntomas que influyen en más de una
enfermedad. En la tabla 1, se muestra la prevalencia de las enfermedades consideradas
para el entorno A.

4
Tabla 2: Se muestra los niveles de sensibilidad y especificidad de los síntomas para la
enfermedad Estemfiliosis (E). Cuando E=0, indica ausencia de la enfermedad
Estemfiliosis, E=1 indica presencia de la enfermedad, esto cumple para los demás casos.

Figura 4: Muestra la sensibilidad y especificidad en porcentaje, de los síntomas típicos


de la Estemfiliosis así como la suma de sensibilidad y especificidad para cada síntoma.

5
Figura 5: Muestra el nivel de presencia (en porcentaje) de la enfermedad Estemfiliosis
cuando aparece un determinado síntoma que está relacionado con la enfermedad.

6
Tabla 4: Dada la presencia de síntomas exclusivos de la enfermedad Roya, se muestran
los resultados en el diagnóstico general.

CONCLUSIONES ( AUTORES )

Los síntomas con baja especificidad y sensibilidad, cuando no son visibles, permiten
establecer mucha más duda de que la enfermedad pueda aparecer, aún teniendo
síntomas con altas sensibilidades visibles, por ello es recomendable usar siempre
síntomas que traten de caracterizar en lo mejor posible a una enfermedad, teniendo altas
sensibilidades y especificidades para tener mucha más precisión a la hora de responder
una consulta. Ello requiere que los estudios estadísticos acerca del entorno donde se va
a implantar el sistema, tengan mucha confiabilidad en los datos, acerca de experiencias
pasadas, entre las relaciones de los síntomas y la enfermedad (o enfermedades). El
sistema es totalmente ajustable a cualquier entorno, con el estudio estadístico de
síntomas y enfermedades correspondientes. Esto permite adaptar los resultados de
diagnóstico al mismo lugar en donde se implantará el sistema, lo cual es muy ventajoso
puesto que los resultados llegan a ser más fiables, si el estudio estadístico del entorno
es correcto.

Análisis espacial de la mortalidad en áreas geográficas pequeñas. El enfoque


bayesiano

Planteamiento del problema

La representación mediante mapas, de ciertos acontecimientos de salud relevantes


(como la distribución de la mortalidad) proporciona, en algunos casos, una imagen más

7
elocuente de su configuración espacial, que la mera observación de datos organizados
en tablas. Tal perspectiva aporta, como mínimo, una apreciación complementaria para
las representaciones clásicas, ya que pueden manifestarse patrones expresivos de
ordenamiento geográfico de esos sucesos. Si bien los estudios asociados a este enfoque
pueden verse afectados por el llamado sesgo ecológico,1 es imprescindible comprender
que no siempre se quiere “trasladar” las conclusiones propias del ámbito grupal al
individual, en cuyo caso el sesgo no es motivo de preocupación. Por otra parte, las
ventajas de su desarrollo son obvias: tienen bajo costo y permiten responder preguntas
relacionadas con el ambiente muy difíciles de encarar por otros medios.2-4

En su vertiente descriptiva, este tipo de análisis permite detectar la existencia de


agrupaciones espaciales, y contribuye a cuantificar en términos absolutos y relativos la
importancia de las diferencias presentes en un territorio5 (típicamente un país). Es muy
útil para la vigilancia de las enfermedades crónicas.6 En la vertiente exploratoria, ayuda
a sugerir posibles explicaciones para las distribuciones identificadas. En efecto, el
estudio de la variación del riesgo en el espacio para cierta causa de muerte puede
permitir la formulación de hipótesis acerca de sus determinantes, y revelar indicios para
orientar futuros estudios de investigación que procuren explicaciones más refinadas.7

Se conoce, sin embargo, que cuando los indicadores se miden sobre espacios
geográficos reducidos, especialmente si, además, el número de casos (numerador) es
pequeño, las tasas brutas de mortalidad o morbilidad son muy “lábiles”, y su
representación a través de un mapa exhibe una variación amplia y poco indicativa de los
patrones vigentes.8

El enfoque tradicional para conjurar este problema ha consistido en representar en los


mapas las razones estandarizadas de mortalidad (REM). Sin embargo, cuando estas se
calculan para áreas en las cuales los casos observados y esperados son escasos, ha
sido porque el desenlace de interés es “raro”, las áreas sobre las que se trabaja son
pequeñas, o incluso, por ambas circunstancias. También se suelen producir
estimaciones del riesgo relativo muy extremas (muy bajas o muy altas en relación con
las demás) que van ubicándose de manera caótica en el mapa hasta el punto de
obstaculizar una interpretación epidemiológica sugerente, útil.

Los métodos bayesianos ofrecen la posibilidad de “corregir” estos mapas, y por la


estabilidad que alcanzan los estimadores, propician que emerjan estructuras que no
pueden apreciarse directamente con los procedimientos estadísticos clásicos. Por eso
numerosos investigadores aplican las técnicas bayesianas para estimar y “mapificar” las
tasas de mortalidad según el área geográfica.9 Como fundamenta Breslow,10 esos
enfoques parecen ser particularmente útiles para esta tarea, porque pueden incorporar
la estimación interna de los efectos de la edad sobre las tasas, y bajo la misma
formulación, contemplar la correlación espacial que suelen exhibir entre sí las diferentes

8
áreas -por ejemplo, es lógico esperar que la mortalidad en cierta unidad territorial, sea
más parecida a la de una contigua, que a la de una distante.

Métodos bayesianos

En primer lugar, recordemos la esencia del enfoque bayesiano. A diferencia de los


métodos estadísticos tradicionales, este enfoque no se reduce a operar con la
información empíricamente conseguida sino que la combina con los criterios a priori que
posee el investigador, nacidos tanto de estudios previos como de reflexiones racionales
y juicios razonablemente conformados. Como resultado de tal integración, que se realiza
por conducto del teorema de Bayes, se obtiene una llamada visión a posteriori que
constituye la base de las inferencias subsiguientes.13

En el marco que nos ocupa, el enfoque bayesiano opera con dos tipos de información
relevantes para la estimación de las tasas de mortalidad o morbilidad en un área
determinada. El primero viene dado por el monto de personas-tiempo considerado en
una determinada área geográfica, y el segundo es el número de defunciones o casos
observados de la enfermedad estudiada. Estos datos permiten el cálculo de las
estimaciones convencionales de las tasas por máxima verosimilitud, bajo el supuesto de
que la variable estudiada (por ejemplo, número de defunciones observadas en un lapso
dado) sigue una distribución Poisson. Como vimos, cuando se trabaja con áreas
pequeñas, es muy posible que se obtengan estimaciones extremas de las tasas en
algunas de ellas. De modo que resulta razonable admitir que las estimaciones obtenidas
dependen de nuestro conocimiento, o de nuestra creencia sobre qué otras áreas
pudieran tener tasas similares a las de aquellas en que hay pocos datos. Para proceder
en esa dirección, se suelen definir unas “adyacencias” a partir de criterios tales como
proximidad geográfica, similitud en materia económica, demográfica, etc. Esto es lo que
configura la información a priori. En el caso más simple, operando como si hubiera una
total ignorancia, se atribuye a las áreas “conflictivas” la media de todas las áreas
presentes en el estudio.

Es obvio que si los casos observados son pocos y el monto de personas-tiempo reducido,
entonces la información a priori será dominante; pero si el monto informativo es alto,
entonces el peso de la información local será tanto o más importante que el de la
contextual.

La creencia a priori sobre las distintas áreas geográficas puede ser representada por una
distribución de probabilidad que estará centrada en el valor que en principio sea más
creíble, y tendrá una variabilidad inversamente proporcional al grado de certidumbre que
quepa atribuir a esa creencia.

9
Desde un punto de vista formal, tal enfoque se ajusta adecuadamente a la teoría de los
modelos jerárquicos bayesianos. En el presente contexto, el teorema de Bayes permite
obtener la distribución a posteriori para las tasas desconocidas como una magnitud
proporcional al producto de la distribución a priori y la verosimilitud de los datos. La
estimación de la tasa es entonces una medida central de la distribución a posteriori.

Procede aquí tener en cuenta que, si bien las REM pueden interpretarse como
estimaciones de máxima verosimilitud del riesgo relativo (RR) bajo un modelo de
Poisson, para enfermedades raras y áreas pequeñas, en cuyo contexto los riesgos
individuales son heterogéneos, la variabilidad del riesgo relativo dentro de cada área
excede al que se podía esperar para una distribución de Poisson. Esta variación “extra-
Poisson” se puede manejar considerando los riesgos relativos dentro de cada área como
una variable. Los métodos bayesianos se pueden usar con tal finalidad, y producir así
estimaciones suavizadas de las REM.
Clayton y Kaldor8 hicieron una propuesta bayesiana para la modelación de los riesgos
relativos, y para evitar así la mencionada inestabilidad de las REM crudas que se
ubicarían en el mapa. La idea básica consiste en imponer una estructura a los riesgos
relativos modelándolos colectivamente como un proceso estocástico espacial. En la
modelación bayesiana esto significa que los riesgos relativos se suponen distribuidos de
acuerdo con una distribución a priori multivariante, cuyos parámetros determinan
aspectos tales como el nivel global del riesgo y la interdependencia geográfica entre los
valores correspondientes a las áreas. La distribución a priori recoge información de todas
las áreas del mapa; posteriormente, para cada área se produce una estimación del riesgo
relativo que es un compromiso entre la REM cruda y la información que se obtiene de
las áreas que la rodean. Las fluctuaciones de las REM crudas son así reducidas, y el
mapa se “suaviza” (se “filtra” la variación de Poisson).

Supongamos que el área total que es objeto de estudio está dividida en n áreas contiguas
representadas mediante los índices i =1,..,n. Llamemos O = (O1,... On) al vector que
tiene por coordenada genérica Oi el número de casos de cierta enfermedad (o número
de muertes) que se produjeron durante el período de estudio para la i-ésima área
geográfica. El vector de casos esperados E = (E1,... En) se calcula aplicando a la
población las tasas específicas por edad y sexo, asumiendo que éstas son constantes
durante todo el período, tal y como se ilustró en la sección precedente. Llamemos x1 al
riesgo relativo, desconocido, correspondiente a la i-ésima área, y denotemos por x =
(x1,..., xn) al vector de los n riesgos relativos.

Lo que se quiere es tener una visión probabilística que combine lo observado con nuestra
apreciación probabilística a priori. Es decir, los métodos bayesianos combinan los dos
tipos de información: la que provee cada área a través de las muertes acaecidas (lo que
permite calcular la verosimilitud suponiendo válido el modelo de Poisson) y la información

10
a priori sobre los riesgos relativos. Coherentemente con el teorema de Bayes, la
distribución a posteriori de los riesgos relativos viene dada por

donde [O|x] es la verosimilitud y [x] la distribución a priori que se atribuya a los riesgos
relativos. La función de verosimilitud es el producto de n distribuciones independientes
de Poisson puesto que los Oi (i = 1,...,n) son mutuamente independientes y siguen una
distribución de Poisson con media x1x1.

Bajo estas condiciones, el estimador de máxima verosimilitud de x i coincide con REM:

Para especificar la estructura a priori para xi existen diversas posibilidades, que van
desde el modelo más simple, en el cual se considera un valor medio hacia el que tiende
cada área, hasta los que postulan una compleja variante de interdependencia entre las
áreas. En este trabajo se considera una estructura en la cual la estimación de los riesgos
relativos en cada área solo depende de los riesgos relativos en las áreas contiguas o
adyacentes. Como se parte de la creencia de que existen correlaciones espaciales entre
los riesgos relativos (por ejemplo, que áreas geográficamente próximas tienden a tener
riesgos relativos similares), se considera una estructura espacial de tal manera que
aquellas áreas que rodean a una cierta área i tengan influencia sobre la estimación del
riesgo relativo en ella (véase anexo).
El proceso de establecimiento de los valores a posteriori para los xi es
considerablemente complejo desde el punto de vista computacional.

11
Conclusión

En conclusión, cuando se trata de estructuras de modelos de decisiones muy grandes y


complejas, se procuran siempre centrar las decisiones en los parámetros y valores en
condiciones de certeza que asumen los criterios de decisión. Las Redes Bayesianas son
un área creciente e importante para la investigación y aplicación en todos los campos de
la Inteligencia Artificial este término es importante ya que las mayorías de problemáticas
encontradas utilizan la teoría de bayes junto a la inteligencia artificial.

Las presentes investigaciones y trabajos presentados en este laboratorio consideran la


toma de decisiones como una función basada únicamente en el ejercicio del análisis de
hechos concretos y se basa en gran medida de la capacidad de hacer inferencias sobre
la ocurrencia de eventos futuros y la relación con el teorema de Bayes y la inferencia
dentro de las redes bayesianas como modelo probabilístico que relaciona las variables
aleatorias mediante un grafo dirigido.

12
Bibliografía

Silva Ayçaguer, C., Benavides Rodríguez, A., & Vidal Rodeiro, C. L. (2003). Análisis espacial de la
mortalidad en áreas geográficas pequeñas: El enfoque bayesiano. Revista Cubana de Salud
Pública, 29(4), 0-0.

Silva Ayçaguer, C., Benavides Rodríguez, A., & Vidal Rodeiro, C. L. (2003). Análisis espacial de la
mortalidad en áreas geográficas pequeñas: El enfoque bayesiano. Revista Cubana de Salud
Pública, 29(4), 0-0.

13

También podría gustarte