Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ejemplo
Supongamos que hay dos eventos los cuales pueden causar que la hierba esté húmeda:
que el rociador esté activado o que esté lloviendo. También supongamos que la lluvia
tiene un efecto directo sobre el uso del rociador (usualmente cuando llueve el rociador
se encuentra apagado). Entonces la situación puede ser modelada con una red Bayesiana
(como hemos visto). Las tres variables tienen dos posibles valores, T (para verdadero) y
F (para falso). La función de probabilidad conjunta es:
Donde los nombres de las variables han sido abreviados a G = Hierba húmeda, S =
Rociador activado, y R = Lloviendo.
El modelo puede responder preguntas como "¿Cuál es la probabilidad de que esté
lloviendo dado que la hierba está húmeda?" usando la fórmula de probabilidad
condicional y sumando sobre todas las variables incordias:
Para analizar los datos de la simulación se han utilizado los siguientes algoritmos de
aprendizaje automático: (1) C4.5 (Quinlan, 1996): Basado en la creación de un árbol de
decisión, C4.5 es el más aplicado entre los de su clase (C45). (2) El vecino más cercano:
Un algoritmo basado en instancias (Aha, et al., 1991). Se usarán los parámetros k=1 y
k=5 (VMC1, VMC5). (3) K2: Algoritmo genérico para creación de redes bayesianas.
(4) Clasificador bayesiano simple (Naive Bayes classifier): Específico para
clasificadores, con estimación de máxima verosimilitud (BS0) y estimador bayesiana
con factor α=1 (BS1).
4. K2: Algoritmo de clasificación que inicia con la red más simple posible, es
decir, una red sin arcos, y supone que los nodos están ordenados. Para cada
variable del problema, el algoritmo añade a su conjunto de padres el nodo con
menor probabilidad que conduce a un máximo incremento de la calidad
correspondiente a la medida de calidad elegida en el proceso de clasificación.
Este proceso se repite hasta que, o bien no se incrementa la calidad o se ha
llegado a una red completa.
– HP
Diagnóstico de problemas de impresora
– Nokia
Diagnóstico de redes celulares
– Nasa
Sistema de ayuda a la decisión en misiones espaciales
Algunas herramientas
Norsys
– Programa: Netica
– Descarga de: http://www.norsys.com/netica.html
Entre los diferentes algoritmos de Minería de datos, los modelos gráficos probabilísticos
(en particular las Redes Bayesianas) constituyen una metodología elegante y potente
basada en la probabilidad y la estadística que permite construir modelos de probabilidad
conjunta manejables que representan las dependencias relevantes entre un conjunto de
variables (cientos de variables en aplicaciones prácticas). Los modelos resultantes
permiten realizar inferencia probabilística de una manera eficiente. Por ejemplo, una
Red Bayesiana podría representar la relaciones probabilísticas entre campos sinópticos
de larga escala y registros de observaciones locales, proporcionando una nueva
metodología de downscaling probabilístico: p. ej. Permite calcular P (observación
|predicción de larga escala). Por ejemplo, en la siguiente figura los puntos rojos
representan nodos de la rejilla de un GCM, mientras que los puntos azules corresponden
a estaciones con registros de observaciones (los enlaces muestran las dependencias
importantes aprendidas de forma automática a partir de los datos).
Formalmente, una Red Bayesiana es un grafo dirigido a cíclico cuyos nodos representan
variables y los arcos que los unen codifican dependencias condicionales entre las
variables. El grafo proporciona una forma intuitiva de describir las dependencias del
modelo y define una factorización sencilla de la distribución de probabilidad conjunta
consiguiendo un modelo manejable que es compatible con las dependencias codificadas.
Existen algoritmos eficientes para aprender modelos gráficos probabilísticos a partir de
datos, permitiendo así la aplicación automática de esta metodología en problemas
complejos. Las Redes Bayesianas que modernizan secuencias de variables (por ejemplo,
series temporales de observaciones) se denominan Redes Bayesianas Dinámicas. Una
generalización de las Redes Bayesianas que permiten representar y resolver problemas
de decisión con incertidumbre son los Diagramas de Influencia.
Por otra parte, las redes neuronales son modelos no lineales, inspirados en el
funcionamiento del cerebro, que fueron diseñados para resolver una gran variedad de
problemas. Los perceptores multi-capa son algoritmos de regresión que construyen un
modelo determinista y=f(x), relacionando un conjunto de predictores, x, y predictandos,
y (figura inferior izquierda). Las redes auto-organizativas (SOM) son redes competitivas
diseñadas para problemas de agrupación y visualización (figura inferior derecha).
7 Ejercicios de inferencia multivariante
Ejemplo 1
Ejemplo 2