Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Apuntes ADM
Apuntes ADM
D ISTANCIA UNED
Apuntes:
Análisis y toma de decisiones en Medicina,
2020-2021
Autor:
Pablo Álvarez Rodrı́guez
17 de diciembre de 2020
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 2
2
Índice general
1. Teorı́a de la probabilidad 7
1.1. Introducción a la probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.1. Variable Aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.2. Concepto de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . 8
1.1.3. Probabilidad Conjunta y Probabilidad Marginal . . . . . . . . . . . 8
1.1.4. Propiedades básicas de las Probabilidades . . . . . . . . . . . . . . 8
1.1.5. Probabilidad Condicional . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.6. Teorema de la probabilidad total . . . . . . . . . . . . . . . . . . . . 10
1.2. Independencia y correlación . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.1. Independencia probabilı́stica . . . . . . . . . . . . . . . . . . . . . . 10
1.2.2. Correlación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.3. Independencia condicional . . . . . . . . . . . . . . . . . . . . . . . 11
1.3. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.1. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3.2. Conceptos básicos en Medicina . . . . . . . . . . . . . . . . . . . . . 13
1.3.3. Valor predictivo de un hallazgo . . . . . . . . . . . . . . . . . . . . . 14
1.3.4. PRECAUCIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3.5. Forma Racional del Teorema de Bayes . . . . . . . . . . . . . . . . . 16
1.4. Método Bayesiano clásico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.1. Fundamentos del método bayesiano clásico . . . . . . . . . . . . . . 16
1.4.2. 1a hipótesis: diagnósticos exclusivos y exhaustivos . . . . . . . . . 17
1.4.3. 2a hipótesis: independencia condicional . . . . . . . . . . . . . . . . 17
1.4.4. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.4.5. Inconvenientes del método bayesiano clásico . . . . . . . . . . . . . 19
1.4.6. Cuándo se puede aplicar el método bayesiano clásico . . . . . . . . 19
3
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 4
2. Redes Bayesianas 21
2.1. Fundamentos de Redes Bayesianas . . . . . . . . . . . . . . . . . . . . . . . 21
2.1.1. Origen histórico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.1.2. Punto de partida: Teorı́a de grafos . . . . . . . . . . . . . . . . . . . 21
2.1.3. Definición de Red Bayesiana . . . . . . . . . . . . . . . . . . . . . . 24
2.2. Ejemplos de Redes Bayesianas . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.1. Ejemplo: Teorema de Bayes 2 variables . . . . . . . . . . . . . . . . 24
2.2.2. Ejemplo: Método bayesiano clásico . . . . . . . . . . . . . . . . . . . 25
2.2.3. Ejemplo: Paludismo . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3. La puerta OR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3.1. Axiomas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3.2. Comparación de la puerta OR . . . . . . . . . . . . . . . . . . . . . . 28
2.3.3. Ejemplo de Puerta OR . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3.4. Cálculo de la tabla de probabilidad . . . . . . . . . . . . . . . . . . 29
2.4. Construcción de Redes Bayesianas . . . . . . . . . . . . . . . . . . . . . . . 31
2.4.1. Información estructural de la red . . . . . . . . . . . . . . . . . . . . 31
2.4.2. Fuentes de Información numérica . . . . . . . . . . . . . . . . . . . 32
2.4.3. Aplicación de la puerta OR en redes bayesianas médicas . . . . . . 32
2.4.4. Contraindicaciones de la puerta OR . . . . . . . . . . . . . . . . . . 33
2.5. Separación en grafos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.5.1. U-Separación: Separación en grafos no dirigidos . . . . . . . . . . . 33
2.5.2. Caminos de tres nodos . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.5.3. Grafos múltiplemente conexos . . . . . . . . . . . . . . . . . . . . . 34
2.5.4. D-separación: Separación en grafos dirigidos . . . . . . . . . . . . . 35
2.5.5. Caminos de tres nodos . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.5.6. Antepasados y descendientes . . . . . . . . . . . . . . . . . . . . . . 36
2.5.7. Grafos múltiplemente conexos . . . . . . . . . . . . . . . . . . . . . 37
2.5.8. Camino activo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3. Teorı́a de la decisión 41
3.1. Introducción a la Teorı́a de la decisión . . . . . . . . . . . . . . . . . . . . . 41
3.2. Árboles de decisión y diagramas de influencia . . . . . . . . . . . . . . . . 41
3.3. Construcción de diagramas de influencia en Medicina . . . . . . . . . . . . 41
4
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 5
5
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 6
6
Capı́tulo 1
Teorı́a de la probabilidad
Una variable aleatoria es aquella que toma valores que, a priori, no conocemos con
certeza.
Los valores que toma una variable han de ser exclusivos y exhaustivos:
Valores exclusivos implica que dos de ellos no pueden ser ciertos simultáneamente.
Valores exhaustivos implica que el conjunto de todos los valores cubre todas las po-
sibilidades.
Se puede cuantificar las variables bien de forma numérica o bien por intervalos. También
se pueden aplicar las variables de forma cualitativa.
7
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 8
Hay que ser muy cuidadoso a la hora de definir variables. Cuando decimos que la pro-
babilidad de sufrir un infarto de miocardio es del 0.005/1, ¿qué queremos decir?.
Unos estudiantes de doctorado estaban construyendo una red Bayesiana para el diagnósti-
co de enfermedades infantiles. Una variable que tenı́an era la mononucleosis, pero esta-
ban pensando en la probabilidad de que el paciente tuviera mononucleosis en ese mo-
mento en concreto. El médico les estaba dando sin embargo la probabilidad de que el
paciente hubiese tenido mononucleosis a lo largo de su vida.
La variable xi tiene que tomar un cierto valor concreto. Para la Probabilidad conjunta
de una serie de variables, se tienen que cumplir todas y cada una de las condiciones
especificadas en la expresión anterior.
Se calcula dividiendo el número de valores que cumple dicha probabilidad conjunta (por
ejemplo mujeres de entre 18 y 65 años) entre el total de la población estudiada.
8
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 9
∑ P(y) = 1 (1.2)
y
P( x ) = ∑ P(x, y) (1.3)
y
(1.5)
P( x, y)
P( x |y) = (1.6)
P(y)
9
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 10
P( x, y) = P( x ) · P(y) (1.9)
P( x |y) = P( x ) (1.10)
10
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 11
1.2.2. Correlación
11
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 12
P( x, y)
P( x |y) = (1.16)
P(y)
P( x, y) = P( x ) · P(y| x ) (1.17)
P(y) = ∑ P(y| x ) · P( x ) (1.18)
x
P( x, y) P( x ) · P(y| x ) P( x ) · P(y| x )
P( x |y) = = = (1.19)
P(y) P(y) ∑ x0 P( x 0 ) · P(y| x 0 )
P( x ) · P(y| x )
P( x |y) = (1.20)
∑ x0 P( x 0 ) · P(y| x 0 )
P ( B | Ai ) P ( Ai )
P ( Ai | B ) = (1.21)
P( B)
donde:
P( B| Ai ) es la probabilidad de B en la hipótesis Ai .
1.3.1. Ejemplo
12
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 13
Solución
Se denomina a E como una enfermedad, y a H como hallazgo, que puede ser desde un
sı́ntoma hasta una prueba de laboratorio.
13
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 14
Lo ideal serı́a tener una prueba con un 100 % tanto de sensibilidad como de especificidad,
de modo que cuando la prueba dé positivo sabemos con certeza que la persona está en-
ferma y viceversa cuando da negativo.
Sin embargo, la mayor parte de las pruebas que existen en medicina, por no decir todas,
tienen falsos positivos y falsos negativos. Y por dicha razón es necesario el concepto del
valor predictivo de un hallazgo:
14
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 15
El valor predictivo positivo se define como P(+e| + h). Según el teorema de Bayes
se toma como:
P(+e) · P(+h| + e)
P(+e| + h) = (1.24)
P(+e) · P(+h| + e) + P(¬e) · P(+h|¬e)
Prevalencia · Sensibilidad
VPP = (1.25)
Prevalencia · Sensibilidad + (1 − Prevalencia) · (1 − Especi f icidad)
1.3.4. PRECAUCIÓN
15
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 16
P(+e)· P(h|+e)
cP(+e|h) = P(+e)· P(h|+e)+ P(¬e)· P(h|¬e)
P(¬e)· P(h|¬e) } (1.30)
P(¬e|h) = P(+e)· P(h|+e)+ P(¬e)· P(h|¬e)
P(+e|h) P(+e) P(h| + e)
→ = · (1.31)
P(¬e|h) P(¬e) P(h|¬e)
P ( h1 , . . . , h m | d1 , . . . , d n )
16
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 17
P ( h1 , . . . , h m | d1 , . . . , d n ) · P ( d1 , . . . , d n )
P ( d1 , . . . , d n | h1 , . . . , h m ) = (1.34)
∑ P(h1 , . . . , hm |d10 , . . . , d0n ) · P(d10 , . . . , d0n )
d10 ,...,d0n
Los diagnósticos exclusivos implicarı́an que el paciente sólo tiene una enfermedad.
Los diagnósticos exhaustivos cubren todas las posibilidades.
El resultado de ambos tipos de diagnósticos es la variable D que representa los diagnósti-
cos posibles.
Con respecto a los parámetros, existen n probabilidades a priori:
P ( di )
Y 2m · n probabilidades condicionadas:
P ( h1 , . . . , h m | d i )
P ( h1 , . . . , h m | d i ) · P ( d i )
P ( d i | h1 , . . . , h m ) = (1.35)
∑ j P ( h1 , . . . , h m | d j ) · P ( d j )
En este caso se supone que para cada diagnóstico, los hallazgos son condicionalmente
independientes entre sı́:
P ( h1 , . . . h m | d i ) = P ( h1 | d i ) · · · · · P ( h m | d i )
17
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 18
P ( di )
Y m · n probabilidades condicionadas:
P ( h j | di )
P ( h1 , d i ) · · · · · P ( h m | d i ) · P ( d i )
P ( d i | h1 , . . . , h m ) = (1.36)
∑ j P ( h1 | d i ) · · · · · P ( h m | d i ) · P ( d j )
En comparación con los casos anteriores, para el mismo número de diagnósticos y paráme-
tros, esto se reduce a 43 parámetros.
1.4.4. Ejemplos
18
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 19
P(s| + e) · P( a| + e) · P(+e)
P(+e|s, a) = (1.39)
P(s| + e) · P( a| + e) · P(+e) + P(s|¬e) · P( a|¬e) · P(¬e)
Para el caso de hipótesis de diagnósticos exclusivos se supone que el paciente sólo tiene
una enfermedad, mientras que para la hipótesis de independencia condicional se presu-
pone que la infección bacteriana afecta a un organismo u otro, genera un sı́ntoma y se
puede comprobar en una prueba clı́nica; pero todas de forma independiente.
19
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 20
20
Capı́tulo 2
Redes Bayesianas
Los antecedentes de las redes bayesianas se remontan a S. Wright, que estudiaba la genéti-
ca en 1921 y las aplicó.
Su desarrollo se realizó durante la década de los 80 con los siguientes referentes:
El concepto de grafo viene de un conjunto de nodos y enlaces, y por tanto pueden haber
tanto grafos dirigidos como no dirigidos. Existe un predecesor, un sucesor un ascendien-
21
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 22
B C
B C
22
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 23
B C
Figura 3: Ciclo
B C
Figura 4: Bucle
Las redes bayesianas y los diagramas de influencia pueden tener bucles pero no ciclos.
A B
C D
E F
A B
C D
E F
23
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 24
B C
D E
Figura 7: Árbol: cada nodo tiene sólo un predecesor, salvo la raı́z, sin padres.
Una Red Bayesiana tiene un conjunto de variables aleatorias. Tendremos un grafo dirigi-
do acı́clico en donde cada nodo del grafo representa una variable Xi .
Se tendrá una distribución de probabilidad condicional (una tabla) para cada variable:
P( xi | pa( xi )). Ira en función de la probabilidad de los predecesores, porque para un nodo
sin padres, se tiene que P( xi | pa( xi )) = P( xi ). Valores de la variable hija por cada valor de
la variable padre.
Se obtiene una probabilidad conjunta para la red, que es el resultado de:
n
P ( x1 , . . . , x n ) = ∏ P(xi | pa(xi )) (2.1)
i =1
24
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 25
P(+e) = 0.002
P(+s| + e) = 0.93
P(+s|¬e) = 0.01
La probabilidad conjunta tendrá cuatro valores, en función de los dos valores para cada
variable:
P(e, s) = P(e) · P(s|e) (2.3)
A S
P(+e) = 0.002
P(+s| + e) = 0.93
P(+s|¬e) = 0.01
P(+ a| + e) = 0.995
25
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 26
Zona de Origen (U1 ): alto riesgo (u1+ ), medio riesgo (u01 ), bajo riesgo (u1− )
U1 U2
Y1 Y2
cP(u1+ ) = 0.10
{ P(u01 ) = 0.10 (2.5)
P(u1− ) = 0.80
26
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 27
cP(+y1 | + x ) = 0.992
{ (2.7)
P(+y1 |¬ x ) = 0.006
cP(+y2 | + x ) = 0.98
{ (2.8)
P(+y2 |¬ x ) = 0.017
Para calcularla, se emplea pura fuerza bruta para cada una de las posibilidades condicio-
nadas, a partir de la fórmula anterior. Como ejemplo se calcula P(+ x |u01 , u2− , ¬y1 , +y2 ) a
partir de determinadas probabilidades conjuntas:
P(u01 , u2− , + x, ¬y1 , +y2 ) = P(u01 ) · P(u2− ) · P(+ x |u01 , u2− ) · P(¬y1 | + x ) · P(+y2 | + x ) =
(2.10)
= 0.10 · 0.40 · 0.12 · 0.008 · 0.98 = 0.0000376
P(u01 , u2− , ¬ x, ¬y1 , +y2 ) = P(u01 ) · P(u2− ) · P(¬ x |u01 , u2− ) · P(¬y1 |¬ x ) · P(+y2 |¬ x ) =
(2.11)
= 0.10 · 0.40 · 0.88 · 0.994 · 0.017 = 0.0005948
27
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 28
Por tanto:
P(u01 , u2− , + x, ¬y1 , +y2 ) 0.0000376
P(+ x |u01 , u2− , ¬y1 , +y2 ) = 0 − = = 0.056 (2.12)
P ( u1 , u2 , ¬ y1 , + y2 ) 0.000632
2.3. La puerta OR
2.3.1. Axiomas
1. Cada una de las causas, por sı́ misma, es capaz de producir el efecto.
2. Basta que una de las causas produzca el efecto para que el efecto esté presente.
4. No hay interacción entre las causas: es decir, la probabilidad del efecto es la proba-
bilidad de que la primera causa lo produzca más la probabilidad de que la segunda
causa lo produzca cuando no lo ha producido la primera más ...
Para el modelo general, se tiene una tabla de probabilidad con cada probabilidad
conjunta P(y| x1 , . . . , xn ), con factores que influyen en la probabilidad de Y.
HTA
Para la puerta OR, se tiene la eficiencia de cada enlace ci con causas que pueden
producir X.
Fiebre
28
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 29
U1 U2
V X
Z Y2 Y1
Mediante el axioma 4:
29
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 30
P(+y2 | + x, +v, ¬z) = P(+y2 | + x, ¬v, ¬z) + P(¬y2 | + x, ¬v, ¬z) · P(+y2 |¬ x, +v, ¬z) =
(2.18)
= 0.979654 + 0.020346 · 0.978245 = 0.999557
P(+y2 | + x, +v) = P(+y2 | + x, +v, ¬z) + P(¬y2 | + x, +v, ¬z) · P(+y2 |¬ x, ¬v) =
(2.19)
= 0.999557 + 0.000443 · 0.015073 = 0.999564
P(+y2 | + x, ¬v) = P(+y2 | + x, ¬v, ¬z) + P(¬y2 | + x, ¬v, ¬z) · P(+y2 |¬ x, ¬v) =
(2.20)
= 0.979654 + 0.020346 · 0.015073 = 0.979961
P(+y2 |¬ x, +v) = P(+y2 |¬ x, +v, ¬z) + P(¬y2 |¬ x, +v, ¬z) · P(+y2 |¬ x, ¬v) =
(2.21)
= 0.978245 + 0.021755 · 0.015073 = 0.978573
P(+y2 | x, v) +x ¬x
v 0.999564 0.978573
¬v 0.979961 0.015073
X V
Y1 Y2
30
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 31
Antecedentes
Sı́ntomas y signos
31
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 32
El problema de la granularidad
Es más fácil de construir, porque necesita menos parámetros. Si se trabaja con una
base de datos, hay más casos para estimar para cada parámetro. Si se trabaja con un
experto humano, se tienen menos parámetros y más intuitivos.
32
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 33
Existen dos formas de detectar la puerta OR, bien a partir de un estudio estadı́stico o bien
conociendo los mecanismos causales.
Cuando alguno de los padres no representa valores ordinales (edad, sexo, paı́s (zo-
na de origen), etc)
No conviene utilizar la puerta OR cuando hay una sola causa explı́cita: La Sensibilidad
se tomarı́a como P(+y| + x ) y la Especificidad como P(¬y|¬ x ) = 1 − P(+y|¬ x )
A B
A B
33
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 34
A B C
A B C
IG ( A, B|C ) si y sólo si no hay ningún camino activo entre A y B. Los caminos activos
han sido bloqueados por los nodos de C.
A B
C D
E F
34
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 35
A B
A B
A B C
A B C
35
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 36
A B
A B
Figura 11: Camino activo, Cola Cola: ¬ IG ( A, B) lleva a Camino bloqueado: IG ( A, B|C )
A B
A B
A B
36
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 37
A B
A B
C D
E F
IG (C, B), C y B están separados, el camino está inactivo por los descendientes.
37
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 38
38
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 39
La definición de camino activo se hace distinguiendo dos casos: los grafos no dirigidos y
los grafos dirigidos:
Un camino de dos nodos, es decir, A − B (un solo enlace), siempre está activo.
Definición 2.4 (Camino activo en un grafo dirigido) Sea un grafo dirigido G con
dos nodos A y B de G y un subconjunto de nodos de G tal que ni A ni B pertenecen
a C:
39
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 40
40
Capı́tulo 3
Teorı́a de la decisión
41
Pablo Álvarez Rodrı́guez, Apuntes Análisis y toma de decisiones en Medicina, página 42
42
Capı́tulo 4
Fundamentos probabilistas de la
inferencia estadı́stica
43