Está en la página 1de 11

Aplicaciones de las redes bayesianas.

1. Definición de red Bayesiana


Una red bayesiana, red de Bayes, red de creencia, modelo bayesiano (de Bayes) o
modelo probabilístico en un gráfico acíclico dirigido es un modelo gráfico
probabilístico (un tipo de modelo estático) que representa un conjunto de variables
aleatorias y sus dependencias condicionales a través de un gráfico acíclico dirigido
(DAG por sus siglas en inglés). Por ejemplo, una red bayesiana puede representar las
relaciones probabilísticas entre enfermedades y síntomas. Dados los síntomas, la red
puede ser usada para computar las probabilidades de la presencia de varias
enfermedades.
Formalmente, las redes bayesianas son grafos dirigidos acíclicos cuyos nodos
representan variables aleatorias en el sentido de Bayes: las mismas pueden ser
cantidades observables, variables latentes, parámetros desconocidos o hipótesis. Las
aristas representan dependencias condicionales; los nodos que no se encuentran
conectados representan variables las cuales son condicionalmente independientes de las
otras. Cada nodo tiene asociado una función de probabilidad que toma como entrada un
conjunto particular de valores de los variables padres del nodo y devuelve la
probabilidad de la variable representada por el nodo. Por ejemplo, si por padres son
variables booleanas entonces la función de probabilidad puede ser representada por una
tabla de entradas, una entrada para cada una de las posibles combinaciones de los padres
siendo verdadero o falso. Ideas similares pueden ser aplicadas a grafos no dirigidos, y
posiblemente cíclicos; como son las llamadas redes de Markov.
Existen algoritmos eficientes que llevan a cabo la inferencia y el aprendizaje en redes
bayesianas. Las redes bayesianas que modelan secuencias de variables (ej. señales del
habla o secuencias de proteínas) son llamadas redes bayesianas dinámicas. Las
generalizaciones de las redes bayesianas que pueden representar y resolver problemas
de decisión bajo incertidumbre son llamados diagramas de influencia.

Ejemplo
Supongamos que hay dos eventos los cuales pueden causar que la hierba esté húmeda:
que el rociador esté activado o que esté lloviendo. También supongamos que la lluvia
tiene un efecto directo sobre el uso del rociador (usualmente cuando llueve el rociador
se encuentra apagado). Entonces la situación puede ser modelada con una red Bayesiana
(como hemos visto). Las tres variables tienen dos posibles valores, T (para verdadero) y
F (para falso). La función de probabilidad conjunta es:

Donde los nombres de las variables han sido abreviados a G = Hierba húmeda, S =
Rociador activado, y R = Lloviendo.
El modelo puede responder preguntas como "¿Cuál es la probabilidad de que esté
lloviendo dado que la hierba está húmeda?" usando la fórmula de probabilidad
condicional y sumando sobre todas las variables incordias:

2. Utilización de redes bayesianas en el triaje


hospitalario

Dada la inexistencia, en nuestro conocimiento, de sistemas de triaje basados en redes


bayesianas, en este trabajo nos proponemos acotar el tipo de urgencias hospitalarias para
las que el sistema debe responder. Siguiendo la opinión de los expertos hemos restringido
el problema a las enfermedades cardiovasculares y respiratorias. Así, solo aquellas
categorías sintomáticas que guardan más relación con estas enfermedades han sido
seleccionadas como variables del grupo (1). Para las variables del grupo (2) y (4) se han
tenido en cuenta también aquellas usadas por Novobilski et al. (2004) para la detección
del síndrome coronario severo.
El sistema que se pretende construir es un sistema en capas, de forma que existirán 3
capas determinadas por el nivel de triaje que se pretende identificar. La figura 2 (a)
presenta dicha configuración en capas. Se considera que para determinar los casos del
nivel 1 no se requiere ni es práctico el uso de sistemas de apoyo a la decisión pues se
debe actuar con sólo una muy rápida apreciación visual. En este trabajo nos hemos
centrado en la capa externa, la más importante pues es la que pretende discernir entre el
nivel de emergencia (nivel 2) y el resto de niveles menos urgentes: niveles 3, 4 y 5. En
fases posteriores, se pretenden diseñar las redes bayesianas para las otras dos capas: la
capa 2, a usar cuando un paciente es de nivel 3 o superior, llamada “Triaje 3” que
determinara aquellos pacientes de nivel de triaje 3 frente a los de nivel 4 y 5 y la capa 4,
a usar en pacientes catalogados como de nivel 4 o 5, llamada “Triaje 4” para distinguir
aquellos de nivel 4 frente a los de nivel 5. Se pretende dotar también al sistema de
variables explicativas o posibles diagnósticos.

Para analizar los datos de la simulación se han utilizado los siguientes algoritmos de
aprendizaje automático: (1) C4.5 (Quinlan, 1996): Basado en la creación de un árbol de
decisión, C4.5 es el más aplicado entre los de su clase (C45). (2) El vecino más cercano:
Un algoritmo basado en instancias (Aha, et al., 1991). Se usarán los parámetros k=1 y
k=5 (VMC1, VMC5). (3) K2: Algoritmo genérico para creación de redes bayesianas.
(4) Clasificador bayesiano simple (Naive Bayes classifier): Específico para
clasificadores, con estimación de máxima verosimilitud (BS0) y estimador bayesiana
con factor α=1 (BS1).

3. Redes bayesianas en la clasificación de datos médicos


El proceso de evaluación de las redes bayesianas a partir de los datos médicos descritos
anteriormente, se llevó a cabo a través de la ejecución de algoritmos de clasificación,
cuya precisión y rapidez de procesamiento son los más utilizados en este tipo de
problemas. Los algoritmos son los siguientes:
1. Naive Bayes: Es uno de los algoritmos de clasificación más efectivo, sus
principales cualidades son su simplicidad y precisión, y aunque su estructura
siempre es fija (la variable clase apuntando a cada nodo) se ha mostrado que
tiene una alta precisión de clasificación y un error mínimo. En términos simples,
Naive Bayes aprende a partir de una muestra de datos de entrenamiento, la
probabilidad condicional de cada atributo dada la clase. Entonces, una vez que
un nuevo caso se da, usa el teorema de Bayes para calcular la probabilidad
condicional de cada nodo seleccionando el valor de la clase con la probabilidad
mayor.

2. Tan: Algoritmo conocido también como Red Bayesiana aumentada a Árbol. El


cual consiste en construir un árbol de dependencias entre las variables que se
van a predecir y que a su vez son hijas de la variable clase. Por lo que la
probabilidad de dichas variables se calculará aplicando el teorema de Bayes con
base en la probabilidad de la variable clase.

3. Hill-Climber: Algoritmo de clasificación que inicia con una red generada de


manera aleatoria. Para cada nodo o variable, el algoritmo agrega o borra
relaciones de manera aleatoria, calculando a partir de la probabilidad conjunta de
la variable clase la probabilidad de cada nodo que forman la red. El algoritmo
elige la red óptima, es decir aquella que tiene la mejor calidad, eliminando
aquellas que no alcanzan su nivel.

4. K2: Algoritmo de clasificación que inicia con la red más simple posible, es
decir, una red sin arcos, y supone que los nodos están ordenados. Para cada
variable del problema, el algoritmo añade a su conjunto de padres el nodo con
menor probabilidad que conduce a un máximo incremento de la calidad
correspondiente a la medida de calidad elegida en el proceso de clasificación.
Este proceso se repite hasta que, o bien no se incrementa la calidad o se ha
llegado a una red completa.

4. Aplicación de las redes bayesianas en las empresas


En una RB, la información proporcionada por una o más variables que se observan (evidencia)
se propaga por la red y actualiza nuestra creencia acerca de las variables no observadas. A este
proceso se le llama inferencia. Es posible aprender las probabilidades condicionales que
describen las relaciones entre las variables a partir de los datos. Incluso es posible aprender la
estructura completa de la red a partir de datos completos o con algunos de sus valores
desconocidos.
Las RB pueden utilizarse para tomar decisiones óptimas introduciendo posibles acciones y la
utilidad de sus resultados.
Redes Bayesianas: Utilización
• Algunas aplicaciones de RB en empresas
– Microsoft
Answer Wizard (Office)
Diagnóstico de problemas de usuario (Aladdin)
Home Health en la red de Microsoft (MSN)
– Intel
Diagnóstico de fallos de procesadores

– HP
Diagnóstico de problemas de impresora
– Nokia
Diagnóstico de redes celulares
– Nasa
Sistema de ayuda a la decisión en misiones espaciales
Algunas herramientas

Norsys

– Programa: Netica
– Descarga de: http://www.norsys.com/netica.html

5. Minería de Datos. Redes Bayesianas y Neuronales


La Minería de Datos es el proceso de extraer información no trivial y potencialmente
útil a partir de grandes conjuntos de datos disponibles en las ciencias experimentales
(registros históricos de observaciones, re análisis, simulaciones de GCMs, etc.),
proporcionando información en un formato legible que puede ser usada para resolver
problemas de diagnosis, clasificación o predicción. Tradicionalmente, este tipo de
problemas se resolvían de forma manual aplicando técnicas estadísticas clásicas, pero el
incremento del volumen de los datos ha motivado el estudio de técnicas de análisis
automáticas que usan herramientas más complejas. Por lo tanto, la Minería de datos
identifica tendencias en los datos que van más allá de un análisis simple. Técnicas
modernas de Minería de datos (reglas de asociación, árboles de decisión, modelos de
mezcla de Gaussianas, algoritmos de regresión, redes neuronales, máquinas de vectores
soporte, Redes Bayesianas, etc.) se utilizan en ámbitos muy diferentes para resolver
problemas de asociación, clasificación, segmentación y predicción.

Entre los diferentes algoritmos de Minería de datos, los modelos gráficos probabilísticos
(en particular las Redes Bayesianas) constituyen una metodología elegante y potente
basada en la probabilidad y la estadística que permite construir modelos de probabilidad
conjunta manejables que representan las dependencias relevantes entre un conjunto de
variables (cientos de variables en aplicaciones prácticas). Los modelos resultantes
permiten realizar inferencia probabilística de una manera eficiente. Por ejemplo, una
Red Bayesiana podría representar la relaciones probabilísticas entre campos sinópticos
de larga escala y registros de observaciones locales, proporcionando una nueva
metodología de downscaling probabilístico: p. ej. Permite calcular P (observación
|predicción de larga escala). Por ejemplo, en la siguiente figura los puntos rojos
representan nodos de la rejilla de un GCM, mientras que los puntos azules corresponden
a estaciones con registros de observaciones (los enlaces muestran las dependencias
importantes aprendidas de forma automática a partir de los datos).
Formalmente, una Red Bayesiana es un grafo dirigido a cíclico cuyos nodos representan
variables y los arcos que los unen codifican dependencias condicionales entre las
variables. El grafo proporciona una forma intuitiva de describir las dependencias del
modelo y define una factorización sencilla de la distribución de probabilidad conjunta
consiguiendo un modelo manejable que es compatible con las dependencias codificadas.
Existen algoritmos eficientes para aprender modelos gráficos probabilísticos a partir de
datos, permitiendo así la aplicación automática de esta metodología en problemas
complejos. Las Redes Bayesianas que modernizan secuencias de variables (por ejemplo,
series temporales de observaciones) se denominan Redes Bayesianas Dinámicas. Una
generalización de las Redes Bayesianas que permiten representar y resolver problemas
de decisión con incertidumbre son los Diagramas de Influencia.
Por otra parte, las redes neuronales son modelos no lineales, inspirados en el
funcionamiento del cerebro, que fueron diseñados para resolver una gran variedad de
problemas. Los perceptores multi-capa son algoritmos de regresión que construyen un
modelo determinista y=f(x), relacionando un conjunto de predictores, x, y predictandos,
y (figura inferior izquierda). Las redes auto-organizativas (SOM) son redes competitivas
diseñadas para problemas de agrupación y visualización (figura inferior derecha).
7 Ejercicios de inferencia multivariante
Ejemplo 1
Ejemplo 2

También podría gustarte