Está en la página 1de 22
CAPITULO 4. SIMULACION E INTEGRACION MONTE CARLO 4.2. METODOS DE SIMULACION MONTE CARLO 4.2.2. Motivacién So presenta un grave problema cuando de desea caleular *(8)f(z10) J (8) f(x|8)a8" (0x) pues el denominador no adopt una forma funcional conocida y no se puede hacer la evaluacién de forma analitica, Se hace necesario el trat rico, que se agrava en muchos casos porque la dimensién del espacio paramétrico es mayor que uno, es decir, 8 = (Br, 04) Si fuera posible generar dixectamente muestras independientes de (8/2) mediante algiin método aleatorio de simulacién, conduciria a la obtencidn de la cantidad a posterior de interés, Pero en muchos casos no es posible simular directamente muestras indepen- dientes para 7(0|z). Sin embargo, puede ser factible simular muestras con algtin tipo de dependencia, que converjan (bajo ciertas condiciones de regularidad) a la distribucién de interés 7(6|x) Se presenta un problema al aplicar integracién Monte Carlo para obtener muestras de la misma complejidad que la distribucién objetivo. Intentar resolver este problema es la raiz de los métodos Monte Carlo via cadenas de Markov. Los métodos basados en simulacién Monte Carlo mediante cadenas de Markov (MCMC) permiten muestrear la distribucién a posteriori, siempre y cuando se conozea Ia forma funcional de la distribucién aunque la constante de normalizacién sea desconc- cida, gracias a la construcién de una cadena de Markov cuya distribucién estacionaria es amente la distribucién a posteriori. A la distribucién a posteriori se le llama distri- bucién objetivo, La clave de la simulacién con cadenas de Markov es crear una cadena de Markov cuya distribucién estacionaria es x(0|z). Se corre la simulacién un tiempo suficientemente largo tal que la distribucién generada en la iteracién actual sea lo suficientemente cerca de Ia distribucién estacionaria. La convergencia hacia tal distribucién objetivo la proporciona el siguiente teorema. Teorema 4.6 Sea 0;,62,... una cadena de Markov homogénea, irreducible y aperiédica, con espacio de estados © y distribucién de equilibrio x(6|z). Entonces conforme t —> 00 @ % 8, donde 0 ~ x(0\z) i) TL ae) + Ptal ot Un método de simulacién Monte Carlo via cadenas de Markov, mas utilizado es el algoritmo de Metropolis-Hastings, el cual se analiza a continuacién, 4.2.3. Algoritmo de Metropolis-Hastings El algoritmo de Metropolis Hastings es un método Monte Carlo via cadenas de Markov que ha sido ampliamente usado en la fisica matemética y restauracién de images por 35 CAPITULO 4. SIMULACION E INTEGRACION MONTE CARLO 4.2. METODOS DE SIMULACION MONTE CARLO muchos aiios, pero recientemente descubierto por los estadisticos. El método en su forma mas simple lo publica Metropolis, el cual se explicaré a continuacién. Supéngase que la verdadera distribucién a posteriori conjunta de wn pardmetro 9 (posiblemente vector de valores) tiene de sidad (8x). Se escoge una fimcién auxiliar g(8;,.1/0:), tal que q(-[8) es una funcién de densidad de probabilidad para toda 6;, ademas es simiétrica, es decir: a(6"|8) = 4(9/0") La funcién q es llamada distribucién de densidad propuesta o candidato- generadora. Entonces, el algoritmo de Metropolis genera una cadena de Markov como Entrada: Conocer la forma funcional de 7(0|z) nn valor arbitrario 69 ¢ sop'(x(8|z)), tal que (Go|) > 0. al cual se alcanza la convergencia. 4(0°|9) distribucién de densidad candidato-generadora, Salida: (80,81, 8, -) 1+ Para f= 0 hasta T. 2- Ge 3- Ge erar una observacién 0° de g(9"|%) erar una variable u ~ U(0, 1) 4~ Dado el punto candidato 6°, calcular (0% 9) = win E71) B- Siu ex ora9| 7 (B1z)a(6"1%.) ain) faeaion Ahora segiin el algoritmo de Metropolis-Hastings, dado que la funcién objetivo no es simétrica entonces CAPITULO 4. SIMULACION E INTEGRACION MONTE CARLO 4.2. METODOS DE SIMULACION MONTE CARLO a5) = ain ( #810") ao") = oun (Se 1) wn ((G) morons) Asi el algoritmo de Metropolis Hastings queda Entrada: 6p es un wimero aleatorio en (0,1) Le Para t= 0 hasta T. 2- Generar una observacién 6" de una Ex(0) 3. Generar una variable u ~ U(0, 1) ~ Dado el punto candidato @*, calcular alo" 9) = min ((F) "ex 8" 0) = SiuSa(0*,), hacer bi41 = 6", en caso contrario, hacer 8.21 = 01 6.~ Salida (0, 61, ..., Or). Bjemplo 4.3 Considérese Ia distribucién a posteriori como tuna Be(O)a, 8), es decit (OF) = (1 — aah yeque 4(0|9") = U0, triea, entonces se tiene que x0"12) w(8:|z) = oe ((E)"(8) { el algoritmo de Metropolis Hastings queda La cual es claramente simé a(0",9)) = min ( "3 Entrada: dy es un mimero aleatorio en (0,1) ta T 1+ Para t= 2. Generar una observacién 6" ~ U(0, 1). 38 CAPITULO 4. SIMULACION E INTEGRACION MONTE CARLO 4.2. METODOS DE SIMULACION MONTE CARLO 3.- Generar una variable u ~ U(0, 1) Dado el punto candidato 9*, calcular weas-om( (GC) Siu Sa(0",0,), hacer Jey = 0" fen caso contrario, hacer 8r+1 = 8 6~ Salida (99, 01,07) 39 Capitulo 5 Software La funcisn principal que tiene A! también se le ha agregado un apartado para el anslisis deseriptivo de los datos, espeeffi- camente las funciones que realiza son las siguientes: SBA es la de realizar inferencia bayesiana, aunque = Inferencia bayesiana » Estimacién © Puntual © Por intervalos © Contraste de hipétesis, = Estadistica descriptiva ¢ Diagramas de caja Histogramas © Célenlo de cuantiles © Céleulo de la media y la varianza muestral = Andlisis de sensibilidad El software esta realizado en Visual Basic Net 2005, esto con la intencidn de brindarle al usuario un ambiente de trabajo visual y totalmente amigable. 5.1. Disefio e Implementacién Las funciones principales que realiza el software se pueden presentar de forma muy general mediante un diagrama de carpetas (5.1) A su vex mediante el uso de un diagrama de flujo (5.2) se mu cionan las funciones principales del software. Para un mayor entendimiento del diagrama de flujo a continuacién se explicara en que consiste cada una de las fumciones en dicho diagrama. sstra como se interela- 4 CAPITULO SOFTWARE 5.1. DISENO E IMPLEMENTACION Estagistica descriptive Analisis de sensibiligaa Diagramas || Andiisis de Estimacién de cola _]| Sensiviicas Mecia y varianza muestral Hines Guantiies || Histogramas Estimacién Puntual ——< Por intervalos Contraste de Hic Puntual Unilateral ual Unilateral Abrir datos a funcién le permite al usuario i Figura 5.1: Diagrama de arpetas. ‘esar tuna muestra aleatoria desde un archivo de texto!, los datos ingresados serén cargados a la memoria del programa, ‘Véase el manual anexado a esta tse 42 CAPITULO. 5.1. DISENO E IMPL SOFTWARE Analisis de (aie Apri Datos sensibilidad Mostrar | [Funcién de] | cécuiode | | Wediey verianse dator distribucién | | Cuantiles muestral Histogramas t £ ¥ ¥ a Arion ¥ Apasterior! Eximecién puntual ‘contrast. puntual Wostrar retultedor | Guede, [+ Figura 5.2: Diagrama de flujo Mostrar datos Esta funcién le permite al usuario visualizar la muestra aleatoria que esté cargada en Ja memoria del programa, 43 CAPITULO 5. SOFTWARE 5.1. DISENO EB IMPLEMENTACION Mostrar resultados Esta funcién muestra los resultados obtenidos después de realizar cualquier funeién que sea parte de la inferencia bayesiana o del anslisis descriptivo de los datos. Guardar Esta funcién permite al usuatio guardar los resultados obtenidos en un archivo de texto o una imagen (como es el caso de los diagramas de caja, histogramas y el anélisis de sensibilidad), después de realizar cualquier funcién que sea parte de la inferencia bayesiana o del anélisis descriptivo de los datos. El resto de las funciones que intervienen en el diagrama de flujo, serén explicadas en las siguientes secciones, En cada seccién se incluiré un poco de teorfa e incluso algunos algoritmos desartollados, cuando sea necesario para mostrar la manera en que cada funcién realiza su tarea 5.1.1. Funciones de distribucién Las funciones de distribucién que ANESBA le permitiré al usuario asignarle a los datos serdn las siguientes 1. Bernoulli (con parémetro desconocido 9) 2. Poisson (con parémetro desconocido 2) 3. Exponencial (con pardmetro desconocido 8) 4, Normal (con media conocida y parémetxo desconocido >) 5. Normal (con varianza conocida y par wetro desconocido 8) 5.1.2. Funciones de distribucién a priori Para cada funcidn de distribucién el usuario podré asignarle al parémetro desconocido alguno de los siguientes tipos de fimcién de distribucién a priori 1. Distribucién a priori conjugada 2. Distribucién a priori no informativa 5.13. Func én de distribucién a posteriori Después de que el usuario ingrese la distribuciéu a priori del pardmetro desconocido, esta funcién se encarga de obtener la densidad a posteriori del parémetro desconocido, Dada una observacién de una muestra aleatoria, X = (Xi, Xz,....Xp) donde X, ~ f(zi0) (funcisn de densidad) y una distribucién a priori #(8) (conjugada o por el método de Jeffreys), a continuacién se presenta el célculo de la distribucién a posteriori Para realizar el célculo de la a posteriori se usar el lema (2.7), mediante wn estimador 4 capiTuLo (OB IMPL SOFTWARE suficiente? $(X) del parémetro y su funcién de distribucién 9(s|0) A continuacién se procederé a caleular la funcién de distribucién a priori por método de Jeffeys y a ra las funciones de densidad de distribucién usadas por el software. es la a posteriori, p Modelo Bernoulli/Beta Sea Saja) = 91 a)* S(X) = T=30x, g(t12) = Bi(e|e,n) por (2.1) 10) = | eso Lp S| = — Deseo geet sel % 1 , gz) gy 22 [2_ G2) = rans To Asi, utilizando (2.2) (0) « 1(0)3 Fa -0y 3 « an (9) « 10)? =0 31-0) ae(ol 5) "a demostraciin de que cada cotadistico que ae tomard a continuacin es sufciente puede verse en [11 45 CAPITULO 5. SOFTWARE 5.1. DISENO E IMPLEMENTACION Ahora se caleulard la a posteriori usando el lema (2.7) (|Z) x x(8)a(t\9) = otd-1(1 9)" 1 cc Be(oftsdn—es Be( d+ 5, ; 1 1 1(0|#) = Be (e+ Gene) Modelo Poisson/Gamma Dada ,o® find) =~ exp(-a) a(t\8) = Pn(t\nd), por la ecuacién (2.3) Iuego usando el lema (2.7) la a posteriori queda como (na)'] cx exp(-nd) nO) & xQava) « (r#) [SBE 7 AE) exp(—na) « a( af 5") nlf) = Go(a| ) 46 CAPITULO 5. SOFTWARE Modelo Exponencial/Gamma Supéngase que a(t|8) = Ga(ein, 0), mf log [/(#1A)] jae - Poca - & lal exo( 20) fr = f * pexpl _ Ct pews Gexp(=02) 9, = [expt anyde 0-80 = 6, entonces por la ecuacién (2.2) (2) Inego usando el lema (2.7) x(0|) x (0)Ga(t\n, 4) 1f_O yn = ON eh tel oot exp(—6t) x Ga(G\n,t) x(0|z) = Ga(0|n,t) Modelo Normal ( varianza conocida )/Normal . [34] CAPITULO 5. SOFTWARE 5.1. DISENO E IMPLEMENTACION ndtese que log f(z|@) = Dlog f(z8) _ 08 Plog f(zia) _ ae - «| 2lox Sel0) 10) = ~Byy| PERM) - luego por (2.2) se tiene que ro x0) x Wolt=2 «1 Asi (02) « sex) (a ~ oF] [3 ox exp -a(Se -0 ye +n) « exp = a2 +n) Modelo Normal ( media conocida )/Gamma Dada Fail) = N(zil0,2%) 8 conocida, capiTuLo SOFTWARE La distribucién a priori de Jeffreys es Ilo) = log f(x|a) = donde, T= (X -8)?, Alog f(e\a) Oe log Fla! = -0? +30 4B[(x —8)?] +307 *Var(2) 0? + 30-40? = +307 Entonces la a priori queda como (a) cc Ma)? a oh por otro lado x(olZ) x f(#a)n(o)o-! si se toma T — )0(Xi — 8)? mol (8) se que no es distinguible el tipo de distribucién que se tiene, para evitar esto se utiliza Ja siguiente forma equivalente de la funcién de densidad normal F(x) = N(ai\8, A) = ai oF] donde es el parémetro desconocido, asi, se obtiene 49 CAPITULO 5. SOFTWARE 5.1. DISENO EB IMPLEMENTACION lox f(21A)] ie) = o [Page 2) On Jog f(z) Alog f(z) On Plog fal) ox TO) entonces usando (2.2) (A) Ademés se tiene que T = (Xi ~ 8)? es estimador suficiente de A con T ~ Ga(t|¥, 3) por la ecuacién (2.7) se tiene que x(alé) x a(AlE) = Ga(a A continuacién se procederé a caleular la fimeién de distribucién a posteriori, para las funciones de densidad de distribucién antes mencionadas. B] céleulo de la distribucién a posteriori se realiza mediante el lema (2.7) Modelo Bernoulli/Beta Sea F(as|8) = Br(ai\@) (0) = Be(O|a,) sit) = T=yoK g(t|) = Bi(e|0,n). CAPITULO 5. SOFTWARE 5.1. DISENO FE IMPLEMENTACION Entonces por el lema (2.1) a R Be(Ola., 8) Bi(t|0,n) = eo [eee oe ot a? 20'(1 apt = Ho ( a) « Be(alar nan ) (01) = Be(afa.+ 1,04 ~0) Modelo Poisson/Gamma Dada F(eilA) Pn(zxild) x(a) Ga(Ala, 8) S(X) T= >» Xx, ald) = Patter) Entonces x(A\z) & Ga(Ala,A)Pn(t}nd) T ge [Tfe) & A" exp(—GA) At exp(—nd) MOOT oxp[—-(G + n)Al x Ga(alesos #(Alz) Go(alero i) Modelo Exponencial/Gamma Supéngase que f(zi]8) = Bx(z,\6) x(0) = Ga(dla,) s%) = T=ox a a(t/0) = Galtin, 0) CAPITULO 5. SOFTWARE 5.1. DISENO E IMPLEMENTACION Luego por (2.7) x(6|#) «x Ga(G\a, 3)Ga(t\n, 8) a a0 x | [ 8° exp(—8)6" exp(—6t) = 0 lexpl-(8 + 00) o Ga(0 aang) ra) en M1" exp( 61) (02) = Go(o Modelo Normal (varianza conocida) /Normal Si X ~ N(G,0), donde ¢ es desconocido y 7(8) es una N(y1,7*). Entonces usando la ecuacién (2.8) se tiene que (0 /n)u tr (a? /n)r? wor = (of Se iar) (o?/n) +7? (0? /n) opt ne 2 x(0|@) =N (0 as Modelo Normal (media conocida)/Normal Sea vx Sal) = N(w|0,)= S exp (0) = Ga(Ala,A) s(X) = r=S UK oy a a(t) = Gat 5, 3) capiTuLo SOFTWARE Entonces aaj) a0 = Ga(. 5.1.4, Estimacién puntual calculada la distribucién a posteriori del parémetro desconocido, esta funcién Una vez se encarga de encontrar la moda o estimacién puntual de dicho parémetro. Las a posteriori que el software utilizaré son la gamma, la beta y la normal. A continuacién se presenta el procedimiento analitico para encontrar tal estimacién. Distribucién a posteriori gamma Sea (|Z) = Ga(8\a,3), @ > 0, para encontrar 6, la moda de la distribucidn, es necesario maximizar 7(0|7). A continuacién se desatrollan las condiciones necesarias para encontrar el punto z» > 0 donde la funcién Ga(z|q, 8) aleanza su méximo (es claro que el estimador es = 20) Se deriva x(8[z) con respecto a 2, se iguala a cero la derivada y se eneuentre la solueidn, dGa(r\a, 5 1 se SCAT) fica Lexp(—fx)] donde «= de & ven(-82)] Te) d = gle 1 exp(—Sz)] = ef(a-1)2** exp(- ol exp(—Bz) =0 Entonces (a-1)x§?exp(-S20) = 23-1 exp(—Ax0) a-l F— = % — eleual es un punto ertico. CAPITULO 5. SOFTWARE 5.1. DISENO EB IMPLEMENTACION Recudrdese que 29 = 25! > 0 Inego necesatiamente se tendré que a1 > 1 de To coutratio no existe estimador Supéngase a > 1 Para saber si xp maximiza a Ga(r|q,), aplicamos el criterio de la segunda derivada, es decir ver que 4-Ga(z|a, 2) sea negativa en 2 - SaGalz\a, 6) Ba! exp(—P2)] —A[(a — 1) x"? exp Bx) — Bx cxn(-#2))} = cexp( vata 1)fa = 2)2°-3 — pla = 1)2*-? = cexp( vata 1)(a— 22-4 = ex*} exp(—dz) | (a — 1)(a — 2)x" Evaluando en 9 2 (@=1)(o-2)8 _ 26(a-1)9 | Ga(z|qr, 3) # ex exn(-00)| oxy oxo(- 0) entonces Gale @ at0 ¥ claramente se tended que d= 20 Igual que antes luego et 2ypt [ve -I)r*-(6-)Q-2)" | =0, como 2€ (0,1) entonces (a= 1)ag! — (3 -1)(1— 9)! =0. Luego se tiene que 2) Aqui se presentan dos casos asia t #2. De la ecuacién (5.1) x0 Como a € (0,1) entonces oc pe" 1 (6.2) qa-B 62) Nétese que Si at@>2 +a>l y §>l (5.3) Esto es facil de ver pues sia +3 > 2 asi 0 > 2—a— luego de la ecuacién (5.2) O>1-a>2-a-B8 entonces a>1 y F>1 Ahora dado que se cumple lo siguiente zo es maximiza a Be(z|q, 8) si y solo si —Be(z|a,8)| <0. CAPITULO 5. SOFTWARE 5.1. DISENO E IMPLEMENTACION Ahora bien, @ f 2- g-1 a a2 Sele neta 20-60-04 = ef(o- n|o- 2" $1 — 2)81 — 29-209 —1)(1 — 2)? -(@-1) [lo- ne ta = @ 1a — 2)2-3(1 — 2)P) — (a — 1) — Vz2( — 2)? (Ya ay? + (8-18 - 2a" - a] 0-2) = (1 -(B- Ile 1) +(8-1)(8 = 2)2(1 = 2) ‘| = ex2(1 ~ 2)? | (a 1) 2a-M(1~ 2) ~ ar 1) (6-6-2201 - 2) 7 Evaluando la segunda derivada de Be(r|a, 3) en x9 (0,1), se tiene £ Betzla,6) L, oo 7m) [(o lo 2 2a —1)(3—1) + (8-18 oo ee ex§?(1 — 20) >[-(e — 2)(1 ~ 9) ~ 2a ~1)(8 -1) — (8-2) ~)] = xg ?(1 — 20) ?[(a — 2)(8 — 1) — 2(a— 1)(8 — 1) - (8 -2)(1—a)] = cxg*(1 - 20)? [(8 - 1)[a — 2 - 20 + 2] - (8 - 2)(1 - a) = cxf 2(1~ 20) 2[(6 — 1)[-a] - (8 -2)(1 - @)] = cxg*(1 — 20)? *[-08 + a + (2— 8)(1—a)] = crf 3(1 ~ 20)*?[-a8 + 0 +2 ~ 2a ~ 8 + a) = crf ?(1 - 20)* *[-a + 2-3) ex8-2(1 = x9)° [2 — a - 5, nego xy maximiza a Be(zla,8) = 2-a-B<0 & 2l y Bal

También podría gustarte