Está en la página 1de 5

Tarea 3: Métodos Bayesianos

Ejercicio 1
Ser diagnosticado por Cáncer es cada vez más común en nuestra sociedad ante lo cual la medicina
moderna no ha podido encontrar una cura efectiva para esta enfermedad. Estudiado los datos de
un hospital de la región metropolitana que contiene los datos de 70 niños con cáncer, estos datos
tienen una codificación si los niños sobrevivieron al cáncer o si estos murieron, interesa calcular
los niños que sobrevivieron al cáncer

Respuesta:

Para empezar lo primero que deberíamos hacer es mostrar la codificación de la variable que
definiremos como x
1 𝑠𝑖 𝑒𝑠𝑡𝑒 𝑠𝑜𝑏𝑟𝑒𝑣𝑖𝑣𝑖𝑜
X={
0 𝑠𝑖 𝑚𝑢𝑟𝑖𝑜
Los casos de sobrevivientes son ∑ 𝑥 = 34

Como se puede ver a simple vista esta variable se comporta Bernoulli que definiremos como x/Z ~
Ber(p) y tendrá una distribución a priori Beta porque La distribución beta es adecuada para
variables aleatorias continuas que toman valores en el intervalo (0,1)

Z~ Beta(1,1)

𝑓(𝑥|𝑝 ) = ∏(𝑝)𝑥 (1 − 𝑝)1−𝑥 = (𝑝)∑ 𝑥 (1 − 𝑝)𝑛−∑ 𝑥

Γ(𝛼+𝛽)
𝑓(𝑥|𝑝 ) 𝜋(𝑝) = (𝑝)∑ 𝑥 (1 − 𝑝)𝑛−∑ 𝑥 * Γ(𝛼)Γ(𝛽) ∙ (𝑝)𝛼−1 (1 − 𝑝)𝛽−1

Γ(𝛼+𝛽)
= Γ(𝛼)Γ(𝛽) ∙ (𝑝)∑ 𝑥+𝛼−1 (1 − 𝑝)𝑛+𝛽−∑ 𝑥

p/x ~ Beta(∑ 𝑥 + 𝛼 − 1, 𝑛 + 𝛽 − ∑ 𝑥 )
p/x ~ Beta(34,37)

𝛼 34
con estimador de bayes
𝛼+𝛽
= 34+37
= 0.479
posteriormente haremos un intervalo de credibilidad del 95% para la proporción

𝐼𝐶95% = [0.369 5 ; 0.5941]

Si lo comparamos con el estimador frecuentista

∑𝑥 34
= = 0.4857
𝑛 70

Con intervalo de confianza al 95%

𝐼𝐶95% = [0.3686 ; 0.6028]

Tanto el intervalo de bayes como el frecuentista contienen el parámetro y son muy similares para
este caso, tenemos que el intervalo de confianza realizado para el caso bayesiana proviene de una
distribución asimétrica

Posteriormente vamos a obtener una muestra de 15000 datos provenientes de una distribución
beta a través del método metrópolis-hasting que ocupa simulación Montecarlo

Figura 1 histograma proveniente de una distribución a posteriori beta


Al calcular el estimador de bayes bajo pérdida cuadrática es 0.4789 (𝐸[𝜇|𝑌]). El verdadero valor de
sobrevivencia de niños de cáncer para una simulación de 15000 datos es del 47.89%.

Con un intervalo de confianza del 95% para 𝑝 el verdadero valor del contenido porcentual de que
un niño sobreviva se encuentra entre 38.22 y 57.58.

El ejemplo describe una situación característica de un modelo beta-binomial que se da, también, en
otros modelos: al aumentar la evidencia aportada por los datos, la influencia de la distribución a
priori disminuye.

Anexos

library(MASS)

ca=CAncer

sum(ca)

table(ca)

sum(ca!=0)

34+36

a <- 34

b <- 37
alfa <- 0.05

f <- function(x){

(dbeta(x[2], a, b) - dbeta(x[1], a, b))^2 +

(pbeta(x[2], a, b) - pbeta(x[1], a, b) -1 + alfa)^2

res <- optim(c(a/(a+b), a/(a+b)), f)

x <- 1:100 / 100

plot(x, dbeta(x, a, b), type = "l", ylab = "densidad")

lines(c(res$par[1], res$par[1]),

c(0, dbeta(res$par[1], a, b)), col = "red")

lines(c(res$par[2], res$par[2]),

c(0, dbeta(res$par[2], a, b)), col = "red")

lines(c(res$par[1], res$par[2]),

rep(dbeta(res$par[2], a, b), 2), col = "red")

###intervalo para datos frecuentistas

0.4857-1.96*((sqrt(0.4857)*sqrt(1-0.4857))/sqrt(70))

x <- rbeta(1000,34,37)

mean(x)

y <- sort(x)

y[975]

y[25]

#La media muestral es

0.481033

Al ordenar la muestra se obtiene

X(975)= 0.5953

X(25)= 0,3648

#######simulando con muestra grande


curve(x^(34)*(1-x)^37)

f<-function(x){x^(34)*(1-x)^37}

f(1)

N=15000

x=rep(0,N)

M<-1000

##Paso 1

x[1]=0.5

##Paso 2

for(t in 2:N)

y=rbeta(1,x[t-1],1)##Simular la y de la beta con media igual al x[1]

num=f(y)*dbeta(x[t-1],y,1)##Numerador, normal evaluada en el x[1]

dem=f(x[t-1])*dbeta(y,x[t-1],1)##Denominador, se intercambia la media por la posicion

alpha=min(1,num/dem)

u=runif(1)#para comparar el aplha

if(u<=alpha){x[t]=y}else{x[t]=x[t-1]}

x2<-x[(M+1):N]

truehist(x,main="Histograma de números aleatorios")

d<-density(x)

lines(d$x,d$y,col=2,lwd=2)

#resumen

summary(x2)

## intervalo

quantile(x2,0.05)

quantile(x2,0.95)

También podría gustarte