Está en la página 1de 46

UNIVERSIDAD NACIONAL DE INGENIERA

Facultad de Ingeniera Econmica, Estadstica y Ciencias Sociales


Escuela Profesional de Ingeniera Estadstica

Curso
Estadstica Bayesiana

Prof: Richard F. Fernndez Vsquez


rffv.uni@gmail.com

Inferencia Bayesiana
Con el uso de Winbugs

Mtodo de Monte Carlo


El algoritmo de Monte Carlo permite obtener una estimacin
y el error estndar para la media posterior de cualquier
funcin de los parmetros de inters siempre que sea posible
simular valores desde la distribucin posterior.
Suponga que se desea estimar h() usando su media
posterior:
Se simula una muestra independiente 1; ; m a partir de la
distribucin posterior.
El estimador de Monte Carlo para h() y su error estndar
asociado son:

WinBUGS (Windows Bayesian inference Using Gibbs Sampling)


Sofware para hacer anlisis Bayesiano de modelos estadsticos
complejos, usando Mtodos Monte Carlo de Cadenas de
Markov (MCMC).

Elementos para especificar un modelo en WinBUGS


Cdigo con el modelo a simular
Distribuciones iniciales de los parmetros (nodos)
Datos
Valores iniciales de los parmetros

WinBUGS
Para descargar ingrese al siguiente enlace:
http://www.wcsmalaysia.org/analysis/WinBUGS_install.htm
Para instalar el programa WinBUGS basta copiar la carpeta
WinBUGS en cualquier ubicacin.
Este programa no proporciona la distribucin a posteriori,
sino que genera una muestra de dicha distribucin.
Si la muestra es muy grande, esta debe ser muy aproximada a
la verdadera distribucin.

Inferencia Bayesiana
Las dificultades del enfoque bayesiano son la determinacin
de una distribucin a priori y los clculos para obtener la
distribucin a posteriori.

Esta es la frmula para realizar la inferencia bayesiana sobre un


parmetro, sin embargo, para una mayor cantidad de
parmetros requiere de mtodos computacionales.

Inferencia Bayesiana
Adems, el segundo trmino del lado derecho es la funcin de
verosimilitud de la muestra, luego se tiene que:

Entonces, tenemos la frmula general siguiente para obtener


la distribucin a posteriori:

Ejemplo 1
Se desea hacer inferencias estadsticas sobre la proporcin P,
de personas que aprueban la gestin de la alcaldesa de Lima.
Para este fin se tomar una muestra de 40 personas, y se
recibir como informacin a X, el nmero de estas personas
que aprueban dicha gestin.
Supongamos que la informacin disponible sobre esta
proporcin, previa a la toma de datos, evidencia que sus
valores posibles se distribuyen alrededor de 0.5 y con una
dispersin promedio de 0.1.
Luego de tomada la muestra, se registr que 30 de las 40
aprobaban la gestin.

Ejemplo 1
El parmetro que se estima es P, la proporcin de personas
que aprueban la gestin de la alcaldesa de Lima es visto como
una variable aleatoria.
El primer paso consiste en determinar una distribucin de
probabilidades para P, de modo que exprese la informacin
disponible sobre ella, previa a la toma de datos.
Como P es una proporcin, entonces su rango de valores
posibles est entre 0 y 1, por esta razn, podemos pensar en
una distribucin beta, es decir:

Ejemplo 1
Los parmetros y los debemos escoger de modo que se
refleje la informacin disponible, esto es, que los valores
posibles de la proporcin de aceptacin se distribuyen
alrededor de 0.5 y con una dispersin promedio de 0.1.

De esto se obtiene que = = 12.

Ejemplo 1
As, la distribucin a priori de P, es decir, previa a la toma de
datos o nueva informacin recibida, est dada por:

El paso siguiente es determinar la distribucin a posteriori de


P, es decir, la distribucin luego de la toma de datos o nueva
informacin.

Ejemplo 1
La informacin que se ha recibido corresponde a un valor de
la variable aleatoria X, definida como el nmero de personas,
entre las 40 pruebas de la muestra, que aprueban la gestin
de la alcaldesa de Lima. Ntese que se ha observado que X =
30.
La distribucin anterior es en realidad la distribucin
condicional de X dado P = p, es decir:

Ejemplo 1
La distribucin a posteriori de P, dado que X = 30, la
obtenemos de la siguiente manera:

La distribucin obtenida se identifica fcilmente, se trata de


una distribucin beta con parmetros = 42 y = 22.
Denotamos esto mediante:

Ejemplo 1
Esta distribucin a posteriori es la inferencia obtenida bajo el
enfoque bayesiano.
Cualquier conclusin o inferencia particular se obtiene de esta
distribucin, por ejemplo, veamos cmo obtener una
estimacin y un intervalo de confianza del 95% para P.
Una estimacin muy razonable es la media de la distribucin a
posteriori de P, a esta se le denomina la estimacin
bayesiana. As:

Ejemplo 1
Un intervalo de confianza del 95% para P, se obtiene
fcilmente recordando la definicin de intervalo de confianza.
En efecto, buscamos dos valores a y b para los cuales la
probabilidad de que P se encuentre entre ellos sea 0, 95, es
decir:
En este caso la probabilidad corresponde a la distribucin a
posteriori. Por lo tanto, lo anterior es equivalente a que:

Ejemplo 1
De aqu determinamos los valores a y b, lo ptimo es de
manera que minimicen la diferencia entre ellos o, como es
usual, simplemente por los percentiles 2.5 y 97.5, es decir:

A partir de la informacin recibida, y con una probabilidad de


0,95, podemos inferir que la proporcin de la aprobacin de
la gestin de la alcaldesa de Lima, P, se encuentra entre
0,5366 y 0,7666.

1. Especificar el modelo: remarcar la palabra model, en el programa, y en la


barra de opciones elegir Model, en esta opcin escoger Specification

En la ventana de especificacin del modelo elegir primero la opcin check


model:

En la parte inferior de la ventana principal aparecern mensajes sobre el


resultado de las acciones pedidas, por ejemplo, que la sintaxis del modelo
est correcta.

2. Luego se cargan los datos, para esto se debe remarcar la palabra list y luego
presionar sobre la opcin load data:

Al cargar los datos aparecer el mensaje correspondiente en la parte inferior


de la ventana principal:

3. Luego se compila el programa, al hacerlo aparecer el mensaje de


respuesta:

4. Luego se cargan los valores iniciales, previamente se remarca la palabra list


del programa, despus aparecer el mensaje correspondiente:

5. Para finalizar esta etapa, se cargan los valores iniciales, previamente se


remarca la palabra list:

6. Ahora, se regresa a la barra de opciones de la ventana principal y se escoge


la opcin Inference, para definir los parmetros sobre los cuales se har la
inferencia bayesiana (es decir, determinar la distribucin a posteriori):

7. Se escoge la opcin Samples

Al hacerlo aparecer una ventana con las opciones de muestreo, en esta se


escribir el nombre del parmetro para el que se desea determinar la
distribucin a posteriori:

8. Despus de escribir el nombre, asignado en el modelo del programa, se


presiona sobre la opcin set, as quedar definido el parmetro. Esto se
deber hacer para todos los parmetros para los que se desee obtener la
distribucin a posteriori.

9. Luego se regresa a la barra de opciones de la ventana principal y se escoge


la opcin Model, ahora se ejecuta la actualizacin (update), es decir se
generar la muestra aleatoria de la distribucin a posteriori deseada:

Aparecer una ventana en la que se indicar el tamao de muestra deseado,


el cual est predeterminado como 1000 observaciones de la distribucin a
posteriori:

10. Se marca la opcin update para ejecutar, luego aparecer el mensaje


correspondiente:

11. Finalmente, se piden los resultados en la opcin Inference, de la barra de


opciones principal, con la opcin Samples:

12. En la ventana node se busca el parmetro deseado:

13. Entre las opciones, se escoge stats, para ver las estadsticas de la muestra
de la distribucin a posteriori:

O, para ver la muestra generada, la opcin coda:

Esta muestra se puede insertar en una de hoja de clculo de Excel, para


efectuar otros clculos sobre la distribucin a posteriori:

Ejemplo 2
Un procedimiento patrn para ejecutar cierto tipo de tareas
muy similares produce tiempos cuya media es desconocida y,
segn las caractersticas dadas, es considerada, a priori, como
una variable aleatoria M con distribucin normal de media 4
horas y desviacin estndar un dcimo de hora.
Dado cualquier valor , de M, los tiempos necesarios para
ejecutar las tareas siguen una distribucin normal con
desviacin estndar media hora.
Si (X1,X2) = (3, 5; 4, 5) es una muestra aleatoria de tamao 2
de dichos tiempos, veamos cmo proceder con la inferencia
bayesiana de la media de la poblacin de los tiempos M.

Ejemplo 2
El primer paso es determinar la distribucin a priori de M, en
este caso esta est dada por:

Y la distribucin de X, dado M = , est dada por:

Por lo tanto, para determinar la distribucin a posteriori,


tenemos que:

Ejemplo 2
Obtenemos:

Finalmente, se identifica fcilmente la distribucin anterior: se


trata de una distribucin normal con media 4 y varianza
1/108. Denotamos esto mediante:

Veamos cmo obtener una estimacin y un intervalo de


confianza del 95% para M.

Ejemplo 2
La estimacin bayesiana del parmetro es la media de su
distribucin a posteriori. En este caso:

La estimacin de Bayes para la media, M, es igual a 4.

Ejemplo 2
En este caso los valores usuales para a y b (que tambin
minimizan la diferencia entre ellos) son los percentiles 2,5 y
97,5, es decir:

A partir de los valores de la muestra disponible, y con una


probabilidad de 0,95, podemos inferir que la media, M, se
encuentra entre 3,8113 y 4,1886.

Ejemplo 2
Para obtener un intervalo de confianza del 95% para M,
buscamos dos valores a y b para los cuales la probabilidad de
que P se encuentre entre ellos sea 0,95, es decir:

En este caso la probabilidad corresponde a la distribucin a


posteriori. Por lo tanto, lo anterior es equivalente a que:

En WinBUGS
model {
for (i in 1:N) { x[i]~ dnorm(mu, 4)
}
mu~dnorm(4, 100)
}
list(x = c(3.5,4.5), N=2)

Preguntas?