Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ejercicio 1
Ser diagnosticado por Cáncer es cada vez más común en nuestra sociedad ante lo cual la medicina
moderna no ha podido encontrar una cura efectiva para esta enfermedad. Estudiado los datos de
un hospital de la región metropolitana que contiene los datos de 70 niños con cáncer, estos datos
tienen una codificación si los niños sobrevivieron al cáncer o si estos murieron, interesa calcular
los niños que sobrevivieron al cáncer
Respuesta:
Para empezar lo primero que deberíamos hacer es mostrar la codificación de la variable que
definiremos como x
1 𝑠𝑖 𝑒𝑠𝑡𝑒 𝑠𝑜𝑏𝑟𝑒𝑣𝑖𝑣𝑖𝑜
X={
0 𝑠𝑖 𝑚𝑢𝑟𝑖𝑜
Los casos de sobrevivientes son ∑ 𝑥 = 34
Como se puede ver a simple vista esta variable se comporta Bernoulli que definiremos como x/Z ~
Ber(p) y tendrá una distribución a priori Beta porque La distribución beta es adecuada para
variables aleatorias continuas que toman valores en el intervalo (0,1)
Z~ Beta(1,1)
Γ(𝛼+𝛽)
𝑓(𝑥|𝑝 ) 𝜋(𝑝) = (𝑝)∑ 𝑥 (1 − 𝑝)𝑛−∑ 𝑥 * Γ(𝛼)Γ(𝛽) ∙ (𝑝)𝛼−1 (1 − 𝑝)𝛽−1
Γ(𝛼+𝛽)
= Γ(𝛼)Γ(𝛽) ∙ (𝑝)∑ 𝑥+𝛼−1 (1 − 𝑝)𝑛+𝛽−∑ 𝑥
p/x ~ Beta(∑ 𝑥 + 𝛼 − 1, 𝑛 + 𝛽 − ∑ 𝑥 )
p/x ~ Beta(34,37)
𝛼 34
con estimador de bayes
𝛼+𝛽
= 34+37
= 0.479
posteriormente haremos un intervalo de credibilidad del 95% para la proporción
∑𝑥 34
= = 0.4857
𝑛 70
Tanto el intervalo de bayes como el frecuentista contienen el parámetro y son muy similares para
este caso, tenemos que el intervalo de confianza realizado para el caso bayesiana proviene de una
distribución asimétrica
Posteriormente vamos a obtener una muestra de 15000 datos provenientes de una distribución
beta a través del método metrópolis-hasting que ocupa simulación Montecarlo
Con un intervalo de confianza del 95% para 𝑝 el verdadero valor del contenido porcentual de que
un niño sobreviva se encuentra entre 38.22 y 57.58.
El ejemplo describe una situación característica de un modelo beta-binomial que se da, también, en
otros modelos: al aumentar la evidencia aportada por los datos, la influencia de la distribución a
priori disminuye.
Anexos
library(MASS)
ca=CAncer
sum(ca)
table(ca)
sum(ca!=0)
34+36
a <- 34
b <- 37
alfa <- 0.05
f <- function(x){
lines(c(res$par[1], res$par[1]),
lines(c(res$par[2], res$par[2]),
lines(c(res$par[1], res$par[2]),
0.4857-1.96*((sqrt(0.4857)*sqrt(1-0.4857))/sqrt(70))
x <- rbeta(1000,34,37)
mean(x)
y <- sort(x)
y[975]
y[25]
0.481033
X(975)= 0.5953
X(25)= 0,3648
f<-function(x){x^(34)*(1-x)^37}
f(1)
N=15000
x=rep(0,N)
M<-1000
##Paso 1
x[1]=0.5
##Paso 2
for(t in 2:N)
alpha=min(1,num/dem)
if(u<=alpha){x[t]=y}else{x[t]=x[t-1]}
x2<-x[(M+1):N]
d<-density(x)
lines(d$x,d$y,col=2,lwd=2)
#resumen
summary(x2)
## intervalo
quantile(x2,0.05)
quantile(x2,0.95)