Redes Bayesianas

REPÚBLICA BOLIVARIANA DE VENEZUELA
UNIVERSIDAD BICENTENARIO DE ARAGUA

VICERRECTORADO ACADÉMICO
FACULTAD DE INGENIERÍA
ESCUELA DE INGENIERIA DE SISTEMAS
CREATEC- CÚA ESTADO MIRANDA
Redes Bayesianas
CÚA, AGOSTO 2022

Introducción
Actualmente las redes bayesianas son un área creciente e importante para la
investigación y aplicación en todos los campos de la Inteligencia artificial cuando
se trata de estructuras de modelos de decisiones, estos modelan fenómenos
mediante un conjunto de variables y las relaciones de dependencia entre ellas.
Permitiendo estimar la probabilidad posterior de las variables no conocidas, en
base a las variables conocidas.
Estos modelos pueden tener diversas aplicaciones en diversas áreas, para
clasificación, predicción, diagnostico entre otros. Así pues, en el presente trabajo
se abordarán y se profundizara sobre las redes bayesianas, su definición,
importancia y ventajas.
Redes Bayesianas
Antes de abarcarnos en la definición de las redes bayesianas resulta de suma
importancia conocer que significa el término grafo, encontraremos en el uso de
estos las variables por letras mayúsculas, como X, Y, Z, mientras que las letras
mayúsculas en negrita se usan para variables multidimensionales. Si X es una
variable, x denotara un valor de esa variable. De esta manera, un grafo es un par
de conjunto G= (X, L) donde X= (X1,…..Xn) es un conjunto finito de elementos
(nodos) y L es un conjunto de arcos, es decir un subconjunto de pares ordenados
de elementos distintos de X.
Gámez J. & Puerta J. (1998) expresan: “Las redes bayesianas constituyen una
de las herramientas mas poderosas en el diseño de sistemas expertos
probabilísticos, desde un punto de vista grafico una red bayesiana es un grafo
dirigido acíclico, donde los nodos representan las variables del problema que
queremos resolver, estas estructuras nos permiten representar el conocimiento
desde dos puntos de vista cualitativo y cuantitativo.” (p.22)
Así pues, en términos más simples un grafo permite la representación de un
conjunto de variables (nodos) y unas relaciones de dependencia entre ellas
(arcos). Además, como se menciona una de las consideraciones a tomar en
cuenta respecto a los grafos es que encontramos grafos dirigido acíclico llamado
así cuando las aristas son todas dirigidas y ninguno de sus caminos cerrado y
caso contrario se denomina no dirigido.
Encontramos aparte que las relaciones de independencia entre variables se
expresan en un grafo mediante el concepto de d-separación. La d-separación
entre nodos del grafo se corresponde en los modelos gráficos probabilísticos con
independencia condicional de las correspondientes variables aleatorias. De esta
manera, encontramos diferentes tipos de enlaces que aparecen en un grafo
dirigido acíclico que corresponden según los siguientes criterios:
1. Las variables X1 Y X3 serán independientes dado la variable X2
2. Las variables X1 y X3 serán independientes si no conocemos la variable X2
ni ninguno de sus descendientes.
Así pues, un modelo grafico probabilístico no es solo la representación
cualitativa, sino también cuantitativa, de las relaciones de las variables, como
ejemplo podemos decir, si A es el padre de B, es natural que P(B|A) sea el
número que represente la fuerza del enlace entre A y B, pero si C es también
padre de B, entonces las dos probabilidades, P(B|A) y P(B|C), por si solas no nos
dicen nada de cómo se relacionan entre si las tres variables, ya que pueden
interaccionar de diferentes formas, por lo que necesitamos especificar P(A|B,C)
para fijarlo de forma precisa, introducimos la definición de red bayesiana.
Formalmente, entendemos entonces que una red bayesiana es un grafo dirigido
acíclico, los nodos representan variables aleatorias de dominio X1, X2…..,Xn y los
arcos representan relaciones de dependencia entre variables. Las redes
bayesianas asumen que un nodo depende solamente de sus padres y que cada
nodo está asociado a una tabla de probabilidades condicionales, que definen la
probabilidad de cada estado en los que puede estar una variable, dados los
posibles estados de sus padres. Una red bayesiana muestra la probabilidad de
distribución conjunta para un conjunto de X1,X2,…,Xn, de manera que:
P ( X 1, X 2 , … . Xn )=∏ i=1… n P( X 1∨padres ( Xi ) )
Donde X1 representa el valor que toma la variable X y padres(Xi) denota los
valores que tienen el conjunto de los padres en la red bayesiana del nodo X. Por lo
tanto, cada estado de una variable puede ser calculado multiplicando un número
reducido de valores en las tablas de probabilidad.
En concreto en las redes bayesianas, las variables se cuantifican en términos
de probabilidad, debido a esto ofrece dos ventajas fundamentales; primero
encontramos que se pueden trabajar con un gran número de variables al mismo
tiempo, cosa que puede resultar bastante complicada con otras técnicas clásicas,
pero sobre todo la representación gráfica que obtenemos con la red bayesiana, en
la que se observa claramente y a primera vista las relaciones de
dependencia/independencia de las variables en cuestión.
De igual manera, también se utilizan en problemas en los que interviene la
incertidumbre, es decir, donde no se tiene un completo conocimiento del estado
del sistema, sin embargo, podemos realizar observaciones (obtener evidencias) y
actualizar las probabilidades del resto del sistema. Dando un conjunto de
evidencias, las redes bayesianas permiten fácilmente calcular la sensibilidad de
ciertas variables, simplemente modificando las evidencias.
Estas evidencias son consideradas una de las operaciones mas importantes de
las redes bayesianas, ya que facilitan la obtención de conclusiones a medida que
se va conociendo más información. Por ejemplo, en el área medica se puede
obtener un diagnostico para un determinado paciente que presenta ciertos
síntomas (evidencias). El mecanismo para obtener conclusiones a partir de la
evidencia se conoce como propagación de la evidencia o, simplemente,
propagación. Esta tarea consiste en actualizar las probabilidades de las variables
en función de las observaciones. En el caso del diagnóstico médico, se trata de
conocer las probabilidades de cada una de las enfermedades, dados los síntomas
observados en el paciente.
Supóngase un conjunto de variables discretas X= {X1,….Xn} y una función de
probabilidad p(x) en X. Cuando no se dispone de ninguna información, es decir,
cuando no existe evidencia, el proceso de propagación consiste en calcular las
probabilidades marginales p(Xi =xi), también denotadas por p(xi), para cada Xi ϵ X .
Estas probabilidades proporcionan información a priori donde los distintos valores
pueden tomar las variables.
Cuando se dispone de cierta evidencia, el proceso de propagación debe tener
en cuenta estos valores para calcular las nuevas probabilidades. Así, la
propagación de la evidencia consiste en calcular las funciones de probabilidad
condicionada para cada variable dada la evidencia. Estas funciones de
probabilidad condicionada miden el efecto producido por la evidencia en cada
variable. Cuando no se dispone evidencia, las funciones condicionadas son
simplemente las funciones de probabilidad marginales. Encontramos que hay dos
tipos de evidencia:
1. Evidencia firme o específica, se da cuando se asigna un valor concreto a un
variable, es decir, tenemos certeza del estado de dicha variable. Por ejemplo,
tenemos que la variable A representa el resultado de un partido de baloncesto,
con dos posibles estados (ganar, perder); si conocemos que el equipo ha ganado
el partido podremos asignar la probabilidad 1 (certeza absoluta) al estado ganar y
0 al estado perder.
2. Evidencia parcial o virtual de un nodo, permite actualizar las probabilidades
a priori de los estados que puede tomar la variable. Por ejemplo, a la variable
resultado del partido de baloncesto, si el equipo pierde por 20 puntos a pocos
minutos de final, podríamos asignar una probabilidad muy alta a perder y muy baja
a ganar.
Por otro lado, Las redes bayesianas son cada vez más utilizadas en ingeniería,
inteligencia artificial y estadística. Se han aplicado con éxito a dominios como la
medicina antes mencionada, y otros como evaluación de riesgos, visión,
diagnósticos de sistemas y redes, detección de fraude, spam, etc. De esta manera
su aplicación se ha utilizado en diferentes áreas proporcionando una revisión
crítica de los métodos disponibles en la literatura para la predicción de defectos,
argumentando que los modelos basados en tamaño y complejidad no pueden
predecir eficientemente. La incorporación de redes bayesianas teniendo en cuenta
factores como la habilidad de los programadores/analistas, la complejidad del
diseño y los métodos, procedimientos usados, genera predicciones más exactas.
Además, las redes bayesianas pueden ser utilizadas como herramientas de
testeo, como preguntas de tipo “que pasa-si” que ayudan a gestores y al personal
encargado del testeo en la toma de decisiones, también encontramos desarrollo
de redes para estimar la fiabilidad, seguridad de sistemas en distintos ámbitos y se
utilizan como asistentes de diagnóstico para la detección de problemas de
impresión.
Entendemos entonces que las redes bayesianas tienen un numero de
características que hacen posible todas estas aplicaciones antes mencionadas,
entre estas, encontramos que proveen una representación gráfica de las
relaciones explicitas de dependencia de dominio. Un ejemplo son las variables en
la ingeniería de software como el esfuerzo o coste, están influenciados por
muchos factores. Las redes bayesianas nos permiten modelar sistemas complejos
permitiéndonos entender las relaciones causales visualizándolas por medio del
grafo, las cuales están formadas por el componente cualitativo que es el grafo, y
una parte cuantitativa, las tablas de probabilidades, que permiten utilizar criterios
objetivos y subjetivos.
Encontramos también que las redes bayesianas pueden hacer inferencia en
ambos sentidos, es decir, las variables de entrada pueden ser usadas para
predecir las variables de salida y viceversa. Fijando las variables de salida con los
valores deseados, es posible predecir que valores de las variables de entrada
permiten dicha salida. Por ejemplo, usando inferencia hacia adelante, se puede
predecir el numero final de defectos basándose en variables como tamaño del
proyecto, complejidad, esfuerzo en diseño, esfuerzo en testeo, etc. Por el
contrario, podríamos fijar un numero de defectos y predecir que esfuerzo
necesario satisface dicha salida.
Podemos resaltar de igual manera la comparativa con otras técnicas de
estimación que se basan principalmente en la estadística, especialmente en los
modelos de regresión, estos tipos de modelo no pueden representar relaciones
causales y por lo tanto no puede predecir con exactitud al no incorporar todos los
aspectos del dominio. Así pues, no tienen en cuenta el testeo y no producen
estimaciones fiables, no incorporan variables importantes, conllevan defectos
estadísticos y teórico, no tienen en cuenta la incertidumbre, ni los modelos,
entradas y salidas. Por lo tanto, la red bayesiana, tiene en cuenta otras variables
proporcionando así un entorno explicativo que facilita la toma de decisiones.
Tenemos también las redes neuronales, las cuales producen muy buenos
resultados en bases de datos con muchas instancias, sin embargo, a diferencia de
las redes bayesianas, las redes neuronales no consideran la incertidumbre y
además, actúan como una caja negra en el sentido de que no es posible saber
como se ha llegado a los resultados obtenidos, ni pueden ser interpretados los
nodos intermedios. En las redes bayesianas todos los nodos y las tablas de
probabilidad pueden ser interpretados con respecto al dominio.
Conclusión
Las redes bayesianas cuentan con una importancia significativa para los
avances respecto a la inteligencia artificial y manejo de software motivado a las
amplias características que las distingue en su aplicación, encontramos primero
que cuentan con representación gráfica de las relaciones explicitas de
dependencia del dominio, a su vez tienen un componente cualitativo que es el
grafo, y una parte cuantitativa que son las tablas de probabilidades, las cuales
permiten utilizar criterios objetivos y subjetivos.
Además, pueden hacer inferencia en ambos sentidos, es decir, las variables de
entrada pueden ser usadas para predecir las variables de salida y viceversa,
permitiendo fácilmente calcular la sensibilidad de ciertas variables, simplemente
modificando las evidencias, también pueden modelar grados de certidumbre, en
vez de valores exactos de manera efectiva y explícitamente por lo que permiten
realizar predicciones con información incompleta.
Referencias
Gámez J. & Puerta J. (1998) SISTEMAS EXPERTOS PROBABILÍSTICOS.

España: Editorial de la Universidad de Castilla La Mancha.
Tuya J. & Ramos I. (2007) TECNICAS CUANTITATIVAS PARA LA GESTION EN

LA INGENIERIA DEL SOFTWARE. España: Editorial Netbiblo.
Pajares G. (2011) APRENDIZAJE AUTOMÁTICO. España: Editorial Ra-Ma.

Redes Bayesianas

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Redes Bayesianas

Cargado por

Copyright:

Formatos disponibles

REPÚBLICA BOLIVARIANA DE VENEZUELA

UNIVERSIDAD BICENTENARIO DE ARAGUA

CÚA, AGOSTO 2022

Gámez J. & Puerta J. (1998) SISTEMAS EXPERTOS PROBABILÍSTICOS.

Tuya J. & Ramos I. (2007) TECNICAS CUANTITATIVAS PARA LA GESTION EN

Pajares G. (2011) APRENDIZAJE AUTOMÁTICO. España: Editorial Ra-Ma.

También podría gustarte