Está en la página 1de 3

7/2/2021 Test de SIDA positivo y miedo

Introducción
Bayes y los tests clínicos
En nuesto ejemplo

Generalizando

Test de SIDA positivo y miedo


Preguntas frecuentes

Introducción
Supongamos que disponemos de un test clínico capaz de detectar que se sufre una determinada
infección (por ejemplo SIDA). Imaginemos que el resultado cuando se me ha aplicado es positivo
¿cuál sería la probabilidad real de tener la enfermedad?

Recurriremos al teorema de Bayes donde:

H es el parámetro (hipótesis),
D son los datos y

I es la información disponible

siendo las probabilidades:

P (H |DI ) : de la hipótesis dados los datos, D , y la información pertinente, I .


P (H |I ) : es el prior, supuesto valor de H a partir de la información previa (los datos, el

conocimiento, …)
P (D|H I ) : de los datos dado el parámetro theta y la información previa; verosimilitud.

P (D|I ) : de los datos dada la información previa; factor de normalización.

tenemos:

P (D|H )
P (H |DI ) = P (H |I )
P (DI )

I Recoge el marco conceptual y las condiciones del experimento, o la recogida de los datos, es un
aspecto crucial y no debe obviarse; sin embargo, la expresión puede simplificarse considerando
que todos los términos están condicionados por I :

P (D|H )
P (H |D) = P (H )
P (D)

Esto es, la probabilidad de que la hipótesis sea cierta dado un conjunto de datos es igual a la
probabilidad, a priori de la hipótesis (_prior_) por la verosimilitud de los datos, dada la hipótesis
en relación con la probabilidad de los datos.

Bayes y los tests clínicos


ares.inf.um.es/00Rteam/pub/mamutCola/positivoSida.html 1/3
7/2/2021 Test de SIDA positivo y miedo

En el caso que nos ocupa, la hipótesis es: estoy enfermo (E, anotando estar sano por S ) el dato:
test positivo (+ , anotando el resultado negativo con − ).

Debemos determinar la probabilidad de padecer la enfermedad dado el resultado positivo del


test: P (E|+). Reescribiendo la ecuación de Bayes:

P (+|EI )
P (E| + I ) = P (E|I )
P (+|I )

Para responder a la pregunta necesitamos conocer las características relevantes del test, que son:

Sensibilidad, probabilidad de obtener positivo padeciendo la enfermedad: P (+|E). En


nuestro caso vale: 0.95.

Especificidad, probabilidad de obtener negativo si no se sufre la enfermedad: P (−|S ) . En


nuestro caso vale: 0.90, y por tanto los falsos positivos (P (+|S ) ): 0.1

Insistimos en incluir I en la notación, pues debemos resaltar que P (E|I ) es la probabilidad de


estar sano perteneciendo a una población determinada (podemos considerarlo como un factor de
riesgo) y esta es una información que debemos de conocer (es una información adicional
imprescindible), de modo simplificado:

P (+|E)
P (E|+) = P (E)
P (+)

Para determinar el denominador, la probabilidad de un resultado positivo, ya sea por acierto del
test en el caso de enfermos o fallar en el caso sanos, obtenernos el valor:

P (+) = P (E) ⋅ P (+|E) + P (S ) ⋅ P (∗|S )

En nuesto ejemplo
Asumimos que en nuestra población el SIDA tiene una baja prevalencia de un por diez mil
habitantes, así el prior, P (S ) toma el valor de 10 . −4

Por lo tanto:

−4
0.95
P (S |+) = 10 = 0.001896586
−4 −4
10 0.95 + (1 − 10 )0.05

El resultado es un valor muy pequeño, por lo tanto la probabilidad de error del test es muy grande.
Pero ¿qué pasaría de pertenecer a una población con una probabilidad mayor de padecer SIDA?
Por ejemplo, perteneciendo a un grupo de riesgo con P (S ) = 0.1, es decir, una de cada diez
personas de este grupo está enferma.

0.95
P (S |+) = 0.1 = 0.6785714
0.1 ⋅ 0.95 + (1 − 0.1) ⋅ 0.05

Como vemos las características de la población van a influir en el resultado.

Generalizando
Si representamos la probabilidad de acierto para valores crecientes en la proporción de enfermos
en la población:

ares.inf.um.es/00Rteam/pub/mamutCola/positivoSida.html 2/3
7/2/2021 Test de SIDA positivo y miedo

# psp probabilidad de sano con test positivo


# pe probabilidad de estar enfermo (prior)
# ppe propabiliad de dar positivo en enfermo

psp <- function ( pe, pp=0.95 ) pe * pp / ( pe * pp + ( 1 - pe ) * ( 1 - pp ) )

curve( psp, 0, 1, asp = 1,


xlab = "Proporción de enfermos en la población: P( E )",
ylab = "P(E|+)" )

abline( v = c( 0, 1 ), h = c( 0, 1 ), col = "grey" )


title( "Probabilidad de poseer la enfermedad\ncon un test positivo: P(E|+)" )

points( 10^-4, psp( 10^-4, 0.95 ), pch = 20 )


text( 10^-4, psp( 10^-4, 0.95 ), " Primer caso", adj = c( 0, 0 ), offset = 0.5
points( 0.1, psp( 0.1, 0.95 ), pch = 20 )
text( 0.1, psp( 0.1, 0.95 ), "Segundo caso", pos = 4 )

abline( v = 0.5, h = 0.95, col = "grey", lty = 2 )


text( 0, 0.95, "0.95", pos = 4 )

Vemos que para considerar riesgos del 0.95 tenemos que pertenecer a una población con un tasa
de enfermos del 50 por ciento. Solo cuando la incertidumbre es máxima (tan probable tener SIDA
como no tenerlo, relación 1:1) la prueba responde con la especificidad de la prueba.

ares.inf.um.es/00Rteam/pub/mamutCola/positivoSida.html 3/3

También podría gustarte