Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Los diagramas de bloques (DB) son una representación común para calcular la confiabilidad de
sistemas. Esta representación se complementa con técnicas estadísticas para evaluar los parámetros
de la mejor función densidad de probabilidad que represente el tiempo entre fallas. En forma
resumida el método de DB consiste en obtener el valor de confiabilidad de cada elemento del
sistema y posteriormente se encuentra la confiabilidad correspondiente a cada subsistema, al reducir
el sistema a un arreglo equivalente conforme a los sistemas en serie y paralelo que lo constituyen.
Puesto que 0≤ Ri ≤ 1, para un sistema en serie la confiabilidad del sistema decae rápidamente,
conforme se incrementa el número de componentes y será siempre menor o igual que la del
componente menos confiable, esto es: Rs≤ mín{Ri} (Rausand y Høyland, 2004).
Un sistema en paralelo se considera en operación a menos que fallen todos sus componentes.
En la Fig. 2 se muestra el diagrama de bloques para este tipo de sistemas
Nuevamente, suponiendo independencia y que los componentes no pueden ser reparados durante el
período de misión:
Por otra parte, las combinaciones serie-paralelo se analizan fácilmente al transformar algunos
subsistemas en componentes equivalentes en serie o en paralelo (Levitin y Amari, 2009). Por
ejemplo, para calcular la confiabilidad del sistema conformado por el arreglo en serie de los
subsistemas paralelos mostrados en la Fig. 3, primero se transforman los subsistemas en paralelo a
componentes equivalentes en serie.
Suponiendo que RA = 0.9, RB = 0.8, RC = 0.7, RD = 0.6. Entonces, las confiabilidades de los
componentes equivalentes son: RAB = 0.98 y RCD = 0.88.
Con lo cual la confiabilidad del sistema será: RS = 0.8624. Un segundo arreglo se muestra en la Fig. 4,
donde dos subsistemas en serie se encuentran conectados en paralelo.
El procedimiento en este caso consiste en transformar los subsistemas en serie en componentes en
paralelo; obteniéndose las confiabilidades siguientes: RAC = 0.63 y RBD = 0.48. Con lo cual la
confiabilidad del sistema será: RS = 0.8076.
Comencemos nuestro estudio describiendo que son los sistemas complejos. Como ocurre con la gran
mayoría de los conceptos científicos, no podemos definir los sistemas complejos en un simple
enunciado.
En lugar de ´esto, vamos a enumerar las características más importantes que son comunes a todos
los sistemas complejos:
1. Están compuestos de muchas partes que interactúan entre sí. De hecho, el adjetivo “Complejo “en
este contexto no significa solamente que el sistema sea complicado, sino también que está
compuesto de muchas partes, como un complejo industrial.
2. Cada parte tiene su propia estructura interna y esta encargada de llevar a cabo una función
específica.
3. Lo que ocurra a una parte del sistema afecta de manera altamente no lineal a todo el sistema.
Redes Complejas
Las redes complejas son conjuntos de muchos nodos conectados que interactúan de alguna forma. A
los nodos de una red también se les llama vértices o elementos y los representaremos por los
símbolos v1, v2, ..., vN , donde N es el número total de nodos en la red.
Si un nodo vi está conectado con otro nodo vj , esta conexión se representa por una pareja ordenada
(vi , vj ). La definición matemática de una red (también llamada grafo por los matemáticos) es la
siguiente:
De lo contrario, la red se denomina dirigida. Llamaremos a todos los nodos que estén conectados
directamente a un nodo vi, los vecinos de vi. Finalmente, el número ki de vecinos del nodo vi (es
decir, el número de conexiones de vi) se llama la conectividad de vi, y el promedio de estas
conectividades, hki = N −1 PN i=1 ki, es la conectividad de la red.
Aunque la definición formal de una red es ´útil en el desarrollo matemático de la teoría, para
nuestros propósitos basta con considerar que una red es un montón de nodos entre los que existen
conexiones.
Distribución de vecinos Tal vez la propiedad más importante que caracteriza la estructura de una red
compleja es la distribución de vecinos P(k), que nos da la probabilidad de que un nodo escogido al
azar tenga k conexiones (o vecinos).
En los trabajos recientes que se han llevado a cabo para caracterizar a las redes complejas se ha
encontrado que existen tres tipos de distribuciones P(k) importantes, las que determinan tres
estructuras o topolog´ıas2 diferentes: Topología de Poisson P(k) = e −z z k k! ,
(1) Topología Exponencial P(k) = Ce−αk ,
(3) Las redes con topología de Poisson son importantes principalmente por razones históricas, ya que
dichas redes fueron las primeras que se analizaron matemáticamente. Este análisis lo llevaron a cabo
los matemáticos húngaros Paul Erd¨os (1913-1996) y Alfred R´enyi (1921-1970) en la década de los
50s.
Ellos también reportaron la primera transición de fase topológica observada en redes con topología
de Poisson. Por lo tanto, a estas redes también se les conoce como redes tipo Erd¨os-R´enyi. Sin
embargo, a pesar de su importancia histórica, las redes con tipología de Poisson están lejos de ser
una representación realista de las redes reales observadas en la naturaleza. No fue sino hasta 1998
que se comenzó el estudio sistemático de las propiedades
Corte de un grafo:
Supresión de un conjunto de nodos o aristas en el grafo que produce el incremento en el número de
componentes conexas del grafo. Si el grafo no es ponderado, el corte se considera mínimo cuando el
número de nodos o aristas eliminados ha sido mínimo. Por el contrario, si el grafo es ponderado, el
corte mínimo es aquel que suprime el conjunto de menor peso, siendo obtenido el peso del conjunto
a partir de la suma de los pesos de las aristas y nodos considerados independientemente. El corte es
equilibrado cuando el grafo se escinde en dos subgrafos que contienen aproximadamente el mismo
número de vértices.
La simulación Monte Carlo ofrece a la persona responsable de tomar las decisiones una serie de
posibles resultados, así como la probabilidad de que se produzcan según las medidas tomadas.
Muestra las posibilidades extremas —los resultados de tomar la medida más arriesgada y la más
conservadora— así como todas las posibles consecuencias de las decisiones intermedias.
Los científicos que trabajaron con la bomba atómica utilizaron esta técnica por primera; y le dieron el
nombre de Monte Carlo, la ciudad turística de Mónaco conocida por sus casinos. Desde su
introducción durante la Segunda Guerra Mundial, la simulación Monte Carlo se ha utilizado para
modelar diferentes sistemas físicos y conceptuales.
Supongamos que queremos contratar a un gestor que realice operaciones por nosotros en la bolsa
de valores. El gestor presume de haber ganado 50% de rentabilidad durante el último año con una
cuenta de valores de 20.000 dólares. Para confirmar que lo que dice es verdad, le pedimos su track
record auditado. Es decir, el registro de todas sus operaciones verificado por una auditor (para evitar
estafas y cuentas falsas). El gestor nos facilita toda la documentación y procedemos a valorar
la cuenta de resultados.
Vamos a suponer que disponemos de 20.000 dólares. Introducimos las variables correspondientes en
nuestro programa informático y extraemos el siguiente gráfico:
Con los resultados facilitados por el gestor que queremos contratar, se han realizado 10.000
simulaciones. Además los resultados se han proyectado cuatro años. Esto es, 10.000 escenarios
diferentes para esos resultados durante cuatro años. En la gran mayoría de escenarios se genera una
rentabilidad positiva, pero existe una pequeña probabilidad de perder dinero. La simulación de
Montecarlo nos facilita una infinidad de combinaciones para evaluar escenarios de los que a simple
vista no somos conscientes.
Las redes bayesianas modelan un fenómeno mediante un conjunto de variables y las relaciones de
dependencia entre ellas. Dado este modelo, se puede hacer inferencia bayesiana; es decir, estimar la
probabilidad posterior de las variables no conocidas, en base a las variables conocidas. Estos modelos
pueden tener diversas aplicaciones, para clasificación, predicción, diagnóstico, etc. Además, pueden
dar información interesante en cuanto a cómo se relacionan las variables del dominio, las cuales
pueden ser interpretadas en ocasiones como relaciones de causa–efecto. Inicialmente, estos
modelos eran construidos ’a mano’ basados en un conocimiento experto, pero en los últimos ´ anos ˜
se han desarrollado diversas técnicas para aprender a partir de datos, tanto la estructura como los
parámetros asociados al modelo. También es posible el combinar conocimiento experto con los
datos para aprender el modelo. A continuación, veremos una introducción general a redes
bayesianas y los principales métodos de inferencia.
Los valores que pueden tomar las entradas y las salidas pueden ser discretos o continuos. Cuando se
utilizan valores discretos se habla de modelos de clasificación y cuando son continuos de modelos de
regresión.
Un Árbol de Decisión realiza un testeo a medida que recorre sus hojas hasta alcanzar una decisión. En
un árbol se distinguen: nodos internos, nodos de probabilidad, nodos hoja y ramas.
Nodo de decisión:
Indica que una decisión necesita tomarse en ese punto del proceso. Está representado por un cuadrado.
Nodo de probabilidad:
Indica que en ese punto del proceso ocurre un evento aleatorio. Está representado por un círculo.
Rama:
Nos muestra los distintos caminos que se pueden emprender cuando tomamos una decisión o bien ocurre
algún evento aleatorio:
Los arboles de falla son representaciones gráficas organizadas que representan las condiciones o
factores causantes o contribuidores a la ocurrencia de un resultado definido como evento
máximo o tope. Cuando el resultado es el éxito, entonces el árbol
se convierte en árbol de excitó. La representación de un árbol de falla debe ser clara y fácil de
entender, analizar y si es necesario fácil de reconfigurar para facilitar la identificación de:
✓
Factores que afecten la investigación del evento máximo y como se ha generado este.
✓
Factores que afecten las características de confiabilidad y desempeño del sistema, podemos considerar que
3.
cuando las técnicas de FTA son usadas para el análisis de la confiabilidad es factible analizar por
ejemplo; deficiencias en el diseño, estrés operacional o del medio ambiente, errores de
operación, fallas en el software entre
otros.
✓ Eventos que afectan la funcionalidad de mas de un componente, el cual puede cancelar los
beneficios de incluir
redundancia, o pueden afectar a mas de dos componentes de forma similar, o bien afectan la
independencia.
Los análisis de arboles de falla son métodos deductivos (razonamiento haca atrás ó de arriba
hacia abajo) que permiten realizar combinaciones de eventos te tal forma que se puede simular
la forma en que el evento máximo se ha desarrollado, como se ha comentado los análisis de los
arboles de falla pueden ser cualitativos o cuantitativos.
En el caso que la probabilidad de ocurrencia de los eventos primarios no pueda ser estimada, un
análisis cualitativo puede ser utilizado para investigar las causas potenciales que generaron el
evento máximo, aquí es factible denominar a los eventos primarios en forma descriptiva, por
ejemplo indicando que un evento es “poco probable”, “muy probable” o “medianamente
probable”. El principal objetivo de los análisis cualitativos es la identificación del juego de corte
mínimo para determinar el camino en que el evento básico afecta al evento máximo.
EJEMPLOS:
El suceso TOP estudia las posibilidades de rotura catastrófica de un depósito de amoníaco de 180 m 3,
representado en la figura 3.3.
Por sobrecarga del cuerpo del depósito, que englobaría el fallo del soporte, un exceso de calor
externo y un exceso de presión.
Por defecto mecánico, que englobaría un inadecuado diseño, la corrosión y la fatiga del depósito.
Por rotura frágil, que englobaría una carga externa y la posibilidad de alcanzar una temperatura
por debajo de la crítica y de desarrollar stress corrosion cracking.
Existen 5 conjuntos mínimos de orden 1, es decir, causas únicas que conducen a la rotura del depósito. Son la
mayoría causas «externas» como un terremoto, un impacto de vehículo o un fallo del asentamiento del
terreno; las restantes son un inadecuado diseño o defecto mecánico del equipo.
Existen 13 conjuntos mínimos de orden 2, es decir, combinaciones de dos fallos simultáneos que conducen a la
rotura del depósito. La combinación E16 E17: incendio externo y fallo mecánico del depósito, es un ejemplo.
Existen 10 conjuntos mínimos de orden 3, es decir, combinaciones triples. E4 E5 E6: introducción de un
material corrosivo en el depósito y falta de detección e intervención por parte del operador, es un ejemplo.
Por último la rotura del depósito también puede producirse por un sobrellenado del mismo, pero en este caso
es necesaria la ocurrencia de cinco sucesos al mismo tiempo.
1. Control de calidad de la cisterna para analizar su contenido antes de la descarga, con el fin de:
Verificar que contiene NH3 para evitar la introducción en el depósito de un material incompatible o corrosivo.
Comprobar si presenta un exceso de O2/agua.
4. Colocar un medidor de nivel en el depósito que detenga la operación de carga por alto nivel.
Estas mejoras conducen a la introducción de nuevos componentes (E45, E27, E42, E29, E43 y E44), que se
señalan en el árbol de fallos de la figura 3.4 mediante trazos discontinuos.
Con estas mejoras la distribución en conjuntos mínimos de fallos se modifica de la siguiente forma:
Los sucesos debidos a fenómenos externos se mantienen (conjuntos mínimos de orden 1 y 2), mientras que se
reduce el número de los conjuntos mínimos de fallos de orden 3 (de 10 a 2), apareciendo conjuntos mínimos
de orden 4 y 6.
En la tabla se subrayan los componentes que corresponden a mejoras y que aumentan el orden de los
conjuntos mínimos de fallos.
Ejemplo 2.
El principal elemento que distingue a este método es el uso de las puertas lógicas AND (Y) y OR (O).
La aplicación de estas puertas lógicas puede explicarse y entenderse fácilmente con la comparación
de dos válvulas dispuestas en serie en una tubería.
Ejemplo del método aplicado
Si la única forma para que circule
fluido por la tubería es que ambas En el diagrama adjunto, se puede advertir como evento no
válvulas se encuentren abiertas, deseado la enfermedad respiratoria, provocada por los niveles
puede concluirse que el conector o de material particulado y por las acciones temerarias de las
puerta lógica para que circule fluido personas que, sabiendo de las malas condiciones ambientales,
es un AND, es decir, la válvula 1 y la se exponen sin la protección respiratoria adecuada o realizan
válvula 2 deben estar abiertas para actividades más allá de su limitaciones, aun estando
que circule el fluido por la tubería. debidamente protegidas.
Por su parte, el conector OR puede La lección aprendida, es que lo único que queda en estos casos
es el autocuidado.
explicarse con una configuración en
paralelo de las dos válvulas, en la que
el fluido circulará indistintamente con
al menos una válvula abierta. En este caso, la puerta lógica es un OR, esto es, la válvula 1 abierta o la
válvula 2 abierta para que circule el fluido.
• Se considera que la operación correcta de cualquiera de los dos lazos de control disponibles (caudal
del reactivo B y temperatura de la masa de reacción) es suficiente para mantener la seguridad de la
reacción. Esto es:
• El caudal mínimo garantizado por el tope mecánico de V2 es suficiente para enfriar el reactor
siempre que se mantenga el control Figura 1. Esquema del sistema estudiado. sobre el caudal del
reactivo B. Reactivo B FIC V1 TIC V2 Agua de torre Retorno 3
• El sistema de enfriamiento del reactor tiene capacidad suficiente para enfriarlo, aun cuando se
pierda el control del caudal del reactivo B.
• Obviamente, el agitador es una parte importante del sistema de enfriamiento del reactor. No
obstante, en este caso se ha considerado que el sobredimensionamiento del sistema de enfriamiento
es tal que, incluso con el agitador parado, es suficiente para mantener el control de temperatura. Se
invita al lector a reanalizar el ejemplo teniendo en cuenta uno o varios de estos efectos.
En este ejemplo, el suceso que se pretende analizar es la sobre presurización (y eventual estallido)
del reactor debido a la pérdida de control de la reacción. A este suceso se le denomina “cabecera”
del árbol, se escribe como encabezamiento del árbol de fallos (ver figura 2) y es para el que se
calculará la probabilidad de ocurrencia. Para que se produzca esta sobrepresión inaceptable y
subsiguiente estallido, es necesario que den dos sucesos simultáneamente:
• Que fallen las salvaguardas disponibles: fundamentalmente, que el disco de ruptura no se abra a la
presión prevista.
Dado que estos dos sucesos deben producirse simultáneamente, y el de cabecera no se producirá si
no se dan ambos, se representan en el árbol enlazados con el suceso de cabecera a través de una
puerta lógica “Y” (ver figura 3). El árbol en este punto puede leerse como “se producirá el suceso de
cabecera si se dan la pérdida de control de la reacción Y el fallo de las salvaguardas disponibles”.
El fallo (no apertura) del disco de ruptura es ya un evento suficientemente sencillo para el análisis
que se pretende, por lo que se denomina “suceso elemental” y se representa como un círculo.
En cambio, la pérdida de control de temperatura del reactor es todavía un suceso complejo, que se
debe desarrollar más.
De la descripción anterior del proceso cabe deducir que la pérdida de control de la temperatura
requiere el fallo simultáneo del lazo de control de caudal FIC-V1 y del lazo de control de temperatura
FIT-V2. Así pues, al igual que se ha hecho en el paso anterior, ambos eventos se enlazarán mediante
una puerta lógica “Y” (ver figura 4).
Ambos sucesos son todavía demasiado complejos para el análisis propuesto, por lo que debe
proseguirse su desarrollo. Tomando el caso del fallo del lazo de control de caudal del reactivo B,
puede concluirse que este puede ser debido al fallo de uno cualquiera de los siguientes
componentes:
• El caudalímetro FIC indica un caudal inferior al que realmente está pasando.
• El ordenador de control de la planta no interpreta correctamente los datos del caudalímetro y
ordena abrir en exceso la válvula V2.
• La válvula V2 se abre en exceso a pesar de recibir las señales correctas del ordenador de control.
Dado que uno solo de estos tres eventos puede dar lugar a la pérdida del control de caudal de
reactivo B, se enlazarán mediante una puerta lógica “O”, tal como muestra la figura 5.
Esta sección del árbol de fallos puede leerse como “la pérdida de control del caudal de reactivo B se
produce si se da el fallo del caudalímetro FIC O el fallo del ordenador de control O el fallo de la
válvula V1”. Los tres sucesos identificados son ya suficientemente simples para el análisis que se
pretende, por lo que se considerarán eventos elementales.
Obviamente, el lazo de control de temperatura es análogo al del de caudal de reactivo B, sin más que
reemplazar FIC por TIC y V1 por V2 (en cambio, se considerará que el fallo del ordenador de control
es común para ambos casos). Así, la figura 6 muestra ya el árbol de fallos en su situación final.
Ejemplo 4
"En una empresa química existe una nave de producción en la cual el reactor es refrigerado por una
red de agua industrial en circuito cerrado", siendo ésta enfriada por una torre de refrigeración tal y
como se muestra en el esquema 1.
Esquema 1: Representación del proceso. En trazo negro se representa la situación inicial y en rojo la
implantación de las modificaciones propuestas
Hay veces en verano que la temperatura del agua de este circuito no es suficientemente baja y se
debe enfriar complementariamente con la red de agua potable, mediante la apertura de la válvula
VC-1 que es accionada neumáticamente a través del termostato T.
La empresa se ha planteado con preocupación que la red de agua industrial pudiera contaminar el
agua potable, por las consecuencias que de ello podrían derivarse. (La interconexión de ambas redes
de agua está explícitamente prohibida en la 0.G.S. H.T. en su art. 38.4, por lo que este enunciado
contempla un supuesto teórico cuyo único fin es el de facilitar la comprensión del método y la
reflexión sobre los resultados del análisis probabilístico.)
Obviamente, para que el agua industrial entrase en la canalización de agua potable debería ser la
presión P-1 mayor que P-2 (situación que no se da en condiciones habituales), tendría que fallar la
válvula antirretorno VR-1 y fallar la válvula VC-1, salvo en períodos calurosos en que VC-1 está
abierta. En el análisis de este supuesto se considera que la válvula de control VC-1 se encuentra
cerrada. Obviamente, cuando la válvula de control está abierta por requerimiento del proceso, en la
elaboración del árbol se deberían eliminar los diferentes modos de fallo de este elemento."
Con lo que la probabilidad del suceso no deseado, es decir, de contaminación del agua potable es:
Ejemplo 5
Analizamos en esta nueva situación como varía la probabilidad de contaminación de la red de agua
potable, mediante la elaboración de un nuevo árbol de fallos en el que se contemplan las variaciones
simuladas.
El cálculo de los conjuntos mínimos de fallo y de la probabilidad de contaminación del agua potable
se indica en la figura 7.
Obtendremos la probabilidad de contaminación del agua potable mediante la suma de las
probabilidades de ocurrencia de los conjuntos mínimos de fallo, dando un valor de 6,2685 · 10-10. En
las situaciones en que VC-1 está abierta (período muy caluroso), la probabilidad se incrementa hasta
un valor de 2,0221 · 10-7.
En esta nueva situación, se observa como, con la incorporación de unos determinados elementos
básicos de seguridad, se ha obtenido una importante mejora en cuanto a la fiabilidad de la
instalación en lo referente a la probabilidad de contaminación del agua potable. Tengamos en cuenta
que una probabilidad de daño inferior a 10-1 puede considerarse indicativa de un hecho de
materialización remota, en cuyo entorno podría encontrarse la frontera de aceptabilidad social de las
situaciones de riesgo de graves consecuencias.
Redes bayesianas Las redes bayesianas son una representación gráfica de dependencias para
razonamiento probabilístico, en la cual los nodos representan variables aleatorias y los arcos
representan relaciones de dependencia directa entre las variables.
La Figura 1.1 muestra un ejemplo hipotético de una red bayesiana (RB) que representa cierto
conocimiento sobre medicina.
En este caso, los nodos representan enfermedades, síntomas y factores que causan algunas
enfermedades. La variable a la que apunta un arco es dependiente de la que esta en el origen de
´este, por ejemplo fiebre depende de tifoidea y gripe en la red de la Figura 1.1.
La topología o estructura de la red nos da información sobre las dependencias probabilísticas entre
las variables. La red también representa las independencias condicionales de una variable (o
conjunto de variables) dada(s) otra(s) variable(s).
Por ejemplo, en la red de la Figura 1.1, reacciones es conde. índex. de C, G, F, D dado tifoidea.
(Donde: C es comida, T es tifoidea, G es gripe, R es reacciones, F es fiebre y D es Dolor).
Esto es: P(R|C, T, G, F, D) = P(R|T) (1.1)
Esto se representa gráficamente por el nodo T separando al nodo R del resto de las variables
Definiciones previas
Arco. Es un par ordenado (X, Y). Esta definición de arco corresponde a lo que en otros
lugares se denomina arco dirigido. En la representación gráfica, un arco (X,Y) viene dado por
una flecha desde X hasta Y.
Camino. Es una secuencia ordenada de nodos (X i1, ..., Xir) tal que ∀j =1, ..., r-1, ó bien el
arco Xj →Xj+1 ∈A o bien el arco Xj+1 →Xj ∈A. Camino dirigido. Es una secuencia ordenada
de nodos (Xi1, ..., Xir) tal que para todo j = 1, ..., r-1 el arco X j →Xj+1 ∈A.
Padre. X es un padre de Y si y sólo si existe un arco X →Y. Se dice también que Y es hijo de
X. Al conjunto de los padres de X se representa como pa(X), y al de los hijos de X por S(X).
Dos variables X e Y son independientes si se tiene que P(X/Y) = P(X). De esta definición se
tiene una caracterización de la independencia que se puede utilizar como definición
alternativa: X e Y son independientes sí y sólo sí P(X,Y) = P(X)·P(Y).
Dos variables X e Y son independientes dado una tercera variable Z si se tiene que
P(X/Y,Z) = P(X/Y). De esta definición se tiene una caracterización de la independencia que se
puede utilizar como definición alternativa: X e Y son independientes dado Z sí y sólo sí
P(X,Y/Z) = P(X/Z)·P(Y/Z). También se dice que Z separa condicionalmente a X e Y
Una vez hemos definido las redes bayesianas, vamos a aprender a modelar problemas de la vida real
utilizando este enfoque. En esta sección utilizaremos el siguiente ejemplo.
Una tarde, Juan va a visitar a sus amigos Pablo y Lara. De repente, comienza a estornudar. Juan
piensa que se ha resfriado, hasta que observa que los muebles de la casa están arañados. Entonces,
especula con la posibilidad de que sus amigos tengan un gato y sus estornudos se deban a una crisis
de la alergia a los gatos que tiene diagnosticada.
Principalmente, los tipos de problemas que se suelen modelar con redes bayesianas son problemas
de diagnóstico o problemas de predicción. El ejemplo de la alergia es un problema de diagnóstico,
puesto que Juan intenta determinar la causa de sus estornudos.
En primer lugar, es importante estudiar el dominio para tener el grado máximo de conocimiento y
comprensión sobre el problema que vamos a modelar. En la mayoría de los casos reales, esto nos
obligará a contar con expertos en el área, que deberán estar suficientemente interesados y
motivados para que la colaboración tenga buenos frutos.
Una vez conocemos suficientemente el problema, el siguiente paso consiste en identificar las
variables que son relevantes. Es importante centrarse sólo en aquellas variables que son de interés
en el problema actual. Para ello, ayuda realizarse preguntas del tipo:
Veamos cómo aplicar esto a nuestro ejemplo. En nuestro caso, el problema parece ser que Juan está
estornudando. Las causas posibles son que se ha resfriado o que tiene rinitis. La rinitis puede estar
causada porque sus amigos tienen un gato y Juan es alérgico a los gatos. La evidencia que sugiere
que sus amigos tienen un gato es que algunos muebles tienen arañazos. La
información relevante de la situación está contenida en las seis palabras subrayadas. Ejemplo de
información irrelevante en este caso es que Juan y Pablo son amigos o que Juan está visitando a
Pablo.
En el caso general del modelado de problemas de diagnóstico, hay ciertos tipos de variables
susceptibles de ser agrupados en clases. Si se aborda el problema teniendo estas clases en mente, el
proceso de modelado resulta más sencillo. Hablaremos por tanto de estas clases.
Variables objetivo
Estas variables se usan para modelar los objetos de interés, es decir, aquellos objetos sobre lo que
nos gustaría razonar. Las variables objetivo suelen utilizarse para modelar fenómenos latentes, es
decir, fenómenos que no son directamente observables. En el ejemplo del estornudo, Juan piensa en
dos alternativas: o bien se ha Resfriado o bien tiene Alergia. Ambos son ejemplos
de variables objetivo ya que Juan está interesado en saber más sobre ellas (el estado en el que están
o los valores que tienen). En diagnóstico médico, las enfermedades serían modeladas como variables
objetivo.
Variables de observación
Las variables de observación se usan para modelar las formas indirectas que tenemos de medir las
variables objetivo. También se denominan variables de evidencia. En el ejemplo del stornudo, Juan
piensa que está bien hasta que Es importante identificar las variables relevantes en el problema
Factores
Estas variables se usan para modelar los fenómenos que afectan a las variables objetivo. También se
denominan variables de contexto. En el ejemplo del estornudo, la estación del año podría ser un
factor que afecta al resfriado, pues es más probable que una persona se resfríe en invierno que en
verano. Los factores pueden dividirse en cuatro categorías, con respecto al tipo de influencia en las
variables afectadas.
Promotores. Si el factor promotor ocurre, la variable afectada será más probable (correlación
positiva). Por ejemplo, fumar puede incrementar las probabilidades de tener un cáncer de
pulmón.
Inhibidores. Si el factor promotor ocurre, la variable afectada es menos probable (correlación
negativa). Por ejemplo, practicar deporte puede disminuir las probabilidades de caer
enfermo.
Requeridos. Es indispensable que estos factores entren en acción para sea posible que
ocurran las variables afectadas. Por ejemplo, para que una población específica de bacterias
crezca se requiere que la temperatura esté por encima de un determinado nivel.
Preventivos. Si el factor ocurre, la variable afectada no puede ocurrir. Por ejemplo, recibir la
vacuna de la viruela a edades tempranas previene que se sufra esta enfermedad.
Auxiliares. Son variables que se usan por conveniencia. Por ejemplo, para simplificar el
proceso de modelado y especificación de parámetros.
Esta lista de tipos de variables no pretende ser exhaustiva, sino simplemente ilustrar diversos tipos
existentes. La resumimos en la siguiente tabla.
TIPO DE VARIABLE
Hasta ahora hemos definido varios tipos de variables con respecto al papel que
juegan en el modelado de un problema. Pero también podemos dividir las
según su escala de medición:
Variables cualitativas:
Son las variables que expresan distintas cualidades, características o modalidad. Cada
modalidad que se presenta se denomina atributo o categoría y la medición consiste en una
clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando
sólo pueden tomar dos valores posibles como sí y no, hombre y mujer, o politómicas,
cuando pueden adquirir tres o más valores.
Variables cuantitativas:
Son las variables que se expresan mediante cantidades numéricas. Las variables
cuantitativas además pueden ser discretas, que presentan separaciones o interrupciones en
la escala de valores que puede tomar (por ejemplo, el número de hijos), o continuas, que
pueden adquirir cualquier valor dentro de un rango especificado (por ejemplo la edad).
En el ejemplo del estornudo consideraremos una variable por cada dato identificado como
relevante (dado que las variables no son incompatibles entre sí), y que todas las variables
son dicotómicas, de forma que cada una de las variables tomará el valor “presente” o
“ausente”. En problemas y aplicaciones más sofisticados se podría usar variables discretas
(por ejemplo, la variable estornudo podría tomar los valores pocos, algunos, muchos) o
variables continuas (por ejemplo, si tuviéramos una variable temperatura,
podría tomar los valores que van desde 35,8 a 42,5). Pero evidentemente, cuanto más
valores tomen las variables, más complicado será el modelo, así que a la hora de decidir los
estados deberíamos tener presente qué grado de granularidad es realmente necesario en
nuestra aplicación.
6.5 Estructura
La ausencia de un arco entre dos variables indica que no existen relaciones de dependencia
directa entre ellas, sino a lo sumo a través de otras variables. En el ejemplo del estornudo
las variables Estornudo y Gato no son directamente dependientes, por lo que no debería
haber un arco que las una2.
La presencia de un arco indica una relación de influencia causal entre dos variables. Por
ejemplo, la presencia o ausencia de una enfermedad tiene influencia que el resultado de las
pruebas sea positivo o negativo (Figura 2).
En el ejemplo del estornudo, Gato tiene influencia causal en Arañazos, y por tanto debe
existir un arco entre estas dos variables.
Para ilustrar el motivo por el que se prefiere la dirección causal, vamos a construir una RB
causal para el ejemplo de los estornudos. Una vez definida, calcularemos la red equivalente
con los enlaces invertidos para mostrar que el modelo obtenido es bastante más difícil de
interpretar.
Ejemplo 1:
Vamos ahora a desarrollar el modelo del ejemplo del estornudo. Para ello vamos a asignar a
cada información que hemos considerado relevante en nuestro modelo una variable o nodo,
y los vamos a ir incluyendo en una red que construiremos de modo incremental:
Las causas posible del estornudo son Resfriado o Rinitis. La añadimos al modelo y ahora la
red es:
Lo que causa que Juan piense que él está estornudando podría ser debido a
la Rinitis, causada por la Alergia y la presencia del Gato:
Ejemplo 2:
Supongamos que un señor piensa que su esposa le está siendo infiel. La red bayesiana que
se construye para evaluar esta posibilidad es la siguiente:
variable B se refiere a si la esposa cena con otro hombre o no, la variable C se refiere a si la
esposa es vista cenando con otro hombre o no, y la variable D se refiere a si en el domicilio
se reciben llamadas telefónicas sospechosas o no. Supondremos que la letra minúscula con
el subíndice uno representa a la afirmación del hecho, y la minúscula con el subíndice 2, a la
negación.
En primer lugar, vamos a calcular las probabilidades a priori de cada una de las variables de
la red. Para hacer esto, también podríamos calcular la probabilidad conjunta como producto
de las condicionadas, y luego sumar los términos necesarios para obtener cada
probabilidad, pero este método no es computacionalmente factible en la mayoría de los
casos. Vamos pues a hacerlo con el algoritmo.
Inicialización
A. Ponemos todos los λ-mensajes y λ-valores a 1. 32
π(b1) = P(b1/a1) πΒ(a1) + P(b1/a2) πΒ(a2) = 0.7 0.1 + 0.2 0.9 = 0.25 π(b1) = P(b2/a1) πΒ(a1)
+ P(b2/a2) πΒ(a2) =0.75
Y actualiza su π-valor: π(c1) = P(c1/b1) πC(b1) + P(c1/b2) πC(b2) = 0.4 0.25 + 0.001 0.75 =
0.10075 π(c2) = P(c2/b1) πC(b1) + P(c2/b2) πC(b2) =0.89925.
Lanzamos una moneda M, que puede tomar dos valores ,cara o crux. En función del
resultado de lanzar esa moneda, lanzamos una de dos posibles fichas,F1 o F2.Ambas fichas
tienen dos caras, una roja y otra verde. finalmente, en función del resultado de lanzar la
ficha lanzamos uno de dos posibles dados (rojo y verde ).y registramos el valor obtenido en
dicho lanzamiento .
1.Con que probabilidad obtendremos, en el lanzamiento de los dados un valor menor o igual
a 2?
6.6 Parámetros
Combinar especificación y aprendizaje. Por ejemplo, contar con expertos que nos ayuden a
especificar la estructura, aprender los parámetros y disponer de expertos de nuevo para
supervisar el modelo obtenido. Normalmente, esta última alternativa ofrece lo mejor de cada
caso.
Para los nodos raíz, necesitamos proporcionar las probabilidades anteriores, que son las
probabilidades a priori o en ausencia de información.
Por ejemplo, necesitamos proporcionar la probabilidad del nodo Gato. Para ello, podemos
pensar en la proporción de familias que tienen gato. Si disponemos información disponible
sobre esto (por ejemplo, estadísticas) podemos usarlas, en otro caso, tendremos que hacer uso
de una estimación
la primera es que cuando hay más de una causa presente es más probable que el efecto ocurra
(0.99 comparado a 0.85 y 0.9); la segunda es que la relación entre algunas causas es más
fuerte que entre otras (por ejemplo, en este caso las probabilidades indican que la relación
entre rinitis y estornudo es de alguna manera más fuerte que la relación entre resfriado y
estornudo); la tercera es que, incluso cuando las dos causas están presentes, algo extraño
puede ocurrir y la persona puede no estar estornudando (esta es la razón por la que la
probabilidad es 0.99 y no 1).
----------------------
BIBLIOGRAFIA:
http://www.ugr.es/~jtorres/Tema_2_redes_complejas.pdf
http://bibing.us.es/proyectos/abreproy/11749/fichero/Volumen+I%252FP1-1-
GRAFOSCONCEPTOSBASICOS.pdf
https://scielo.conicyt.cl/pdf/infotec/v21n3/art03.pdf
http://bibliotecadigital.univalle.edu.co/bitstream/10893/8115/1/CB-0460923.pdf
https://www.fis.unam.mx/~max/English/notasredes.pdf
http://www.insht.es/InshtWeb/Contenidos/Documentacion/FichasTecnicas/NTP/Ficheros/301a4
00/ntp_333.pdf
https://www.nebrija.es/~cmalagon/ia/ejercicios/Ejercicios%20de%20redes%20bayesianas.pdf
https://www.nebrija.es/~cmalagon/ia/apuntes/redes_bayesianas_extracted_fdv.pdf
http://www.ia.uned.es/~fjdiez/docencia/videos-prob-dec/3.2-Ejemplos-rb.pdf
https://jaimesotou.files.wordpress.com/2011/05/metodo-montecarlo-03.pdf
https://jaimesotou.files.wordpress.com/2011/05/metodo-montecarlo-04.pdf