Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bayesiana Beamer
Bayesiana Beamer
J. Andrés Christen
Textos
Aun cuando no se sigue ningún texto, los que recomendamos son:
1 J. O. Berger (1985), “Statistical Decision Theory: foundations,
concepts and methods”, Second Edition, Springer-Verlag.
2 Bernardo, J. M. y Smith, A. F. M. (1994), “Bayesian Theory”,
Wiley: Chichester, UK.
3 M. H. DeGroot (1970), “Optimal statistical decisions”,
McGraw–Hill: NY.
4 Para la sección de MCMC se usó C.P. Robert y G. Casella (1999),
“Monte Carlo Statistical Methods”, Springer: NY.
Más bien queremos saber qué sucede dado o una vez que T = 1 (el
test me salió positivo): ¿cual es la probabilidad de que yo esté
enfermo dado que el test salió positivo?
1
pθ (t) = si t = 0.2, 0.5, 0.7
3
y cero en otro caso (esta es la a priori para θ).
pX |θ (x | t)pθ (t)
pθ|X (t | x) = P para t ∈ Mθ
h∈Mθ pX |θ (x | h)pθ (h)
lo escribirı́amos como
f (θ | X ) ∝ f (X | θ)f (θ).
P(X | p ≤ p0 )P(p ≤ p0 )
P(p ≤ p0 | X ) = .
P(X )
y
f (p) = B(α, β)−1 pα−1 (1 − p)β−1 I[0,1] (p),
y entonces
Pn Pn
Xi )−1 Xi )−1
f (p | X ) ∝ p(α+ i=1 (1 − p)(β+n− i=1 I[0,1] (p).
Por lo tanto
n n
!
X X
p | X ∼ Beta α + Xi , β + n − Xi .
i=1 i=1
π(θ1 , θ2 | X ).
(c) (d)
JA Christen (CIMAT) Curso de Bayesiana Ene-May 2019 22 / 209
El concepto de “estimación” dentro de la estadı́stica Bayesiana, no se
entiende más que como resúmenes de la distribución posterior con
la que se cuenta (desde luego que hay resúmenes buenos y
resúmenes malos). Por lo tanto, el concepto de estimación puntual lo
podemos ver como resumir una distribución con un solo punto (por
absurdo que en esta perspectiva parezca).
H1 : θE > θS vs. H2 : θE ≤ θS .
En este caso se sabe que θS = 0.5.
y = X β + ,
X matriz n × p de diseño (o regresores), β vector p × 1 de parámetros,
y vector n × 1 de observaciones (respuesta) y ∼ MVN(0, σIn ).
A priori NIG (normal gamma inversa).
Verosimilitud:
1 n/2
2
f (X |β, σ ) ∝
σ2
1 1 0
exp − 2 (X β − y) (X − y)| .
σ 2
Posterior:
f (X |β, σ 2 ) ∝
1 a+p/2+n/2−1
σ2
·
h n oi
exp − σ12 b0 + 12 (X β − y)0 (X − y) + 12 (β − µ0 )0 V 0 −1 (β − µ0 ) .
1
Ponemos agente en cursivas pues nos referimos no necesariamente a un
individuo. Bien podemos estar hablando de un par de expertos, un panel o, por
ejemplo, de una sociedad en su conjunto o al mundo en su totalidad, que en un
momento dado y para unas circunstancias especı́ficas, se pongan de acuerdo en una
medida de probabilidad para un conjunto de eventos particulares.
JA Christen (CIMAT) Curso de Bayesiana Ene-May 2019 45 / 209
Preferencias entre eventos
A B, A ≺ B, A ∼ B.
Y si para indicar que A no es más verosı́mil que B decimos que
A B.
{c1 | E, c2 | E 0 }.
Supuesto
Para A, B ∈ @, tenemos que
{c ∗ | A, c∗ | A0 } {c ∗ | B, c∗ | B 0 }
si y solo si A B.
Axioma
Para cualesquiera dos eventos A, B ∈ @, exactamente una de las tres
condiciones siguientes es válida: A B, A ≺ B, A ∼ B.
Lema
Suponga que A, B, D ∈ @ son eventos tales que AD = BD = ∅.
Entonces A B si y solo si A ∪ D B ∪ D.
Demostración.
Es una consecuencia del axioma 2 suponiendo A B y tomando
A = A1 , B = B1 y A2 = B2 = D, y suponiendo A B y tomando
B = A1 etc.
Teorema
Sean A, B, D ∈ @ tres eventos tales que A B y B D, entonces
A D.
AB 0 D 0 ∪ AB 0 D A0 BD 0 ∪ A0 BD.
ABD 0 ∪ A0 BD 0 AB 0 D ∪ A0 B 0 D.
AB 0 D 0 ∪ AB 0 D ∪ ABD 0 ∪ A0 BD 0 A0 BD 0 ∪ A0 BD ∪ AB 0 D ∪ A0 B 0 D.
Teorema
Si Ai son n eventos disjuntos, al igual que Bi tales que Ai Bi
entonces ∪ni=1 Ai ∪ni=1 Bi . Si para 2 i tenemos que Ai ≺ Bi , entonces
∪ni=1 Ai ≺ ∪ni=1 Bi .
Teorema
Para cualesquiera dos eventos A, B ∈ @, A B si y solo si A0 B 0 .
Axioma
Si A ∈ @ es un evento, entonces ∅ A. Más aún, ∅ Ω.
Teorema
Si A, B ∈ @ son dos eventos tales que A ⊂ B, entonces A B. En
particular ∅ A Ω.
Teorema
Si A1 ⊂ A2 ⊂ · · · es una secuencia creciente de eventos en @ y B ∈ @
es otro evento tal que Ai B para toda i, entonces ∪∞
i=1 Ai B.
Definición
P medida en @ coincide con si para todo A, B ∈ @, A B si y solo si
P(A) ≤ P(B).
Axioma
Existe una variable aleatoria X en (Ω, @), con 0 ≤ X (ω) ≤ 1, para todo
ω ∈ Ω, tal que para cualesquiera I1 , I2 ∈ B, {X ∈ I1 } {X ∈ I2 } si y
solo si λ(I1 ) ≤ λ(I2 ).
Teorema
Si A ∈ @ es cualquier evento, existe un único número a∗ ∈ [0, 1] tal que
A ∼ G([0, a∗ ]).
Demostración.
Considere a∗ = inf{a : G([0, a]) A}. Acercándose a a∗ por una
secuencia decreciente demuestre que G([0, a∗ ]) A y acercándose a
a∗ mediante una secuencia creciente demuestre que G([0, a∗ ]) A.
Tenga cuidado con los casos a∗ = 0, 1. Ahora, si a1 6= a∗ entonces
necesariamente G([0, a1 ]) no es equivalente a G([0, a∗ ]) y entonces A
no puede ser equivalente a los dos al mismo tiempo.
Teorema
Sean A, B ∈ @ dos eventos. A B si y solo si P(A) ≤ P(B).
Demostración.
Es claro que A B si y solo si G([0, P(A)]) G([0, P(B)]).
Demostración.
Note que si suponemos que B ≺ G((P(A), P(A ∪ B)]) vemos que
Demostración.
Para demostrar la σ–aditividad de P primero se generaliza, por
inducción el resultado anterior para n conjuntos. Después
establecemos que
n
X
P(∪∞
i=1 Ai ) = P(Ai ) + P(∪∞
i=n+1 Ai )
i=1
axioma (que de hecho define lo que queremos decir con “dado D”):
Axioma
A D B si y solo si AD BD.
Teorema
Si P(D) 6= 0,
P(AD)
PD (A) = P(A | D) = .
P(D)
Demostración.
P(A | D) coincide con D porque P(A | D) ≤ P(B | D) si y solo si
P(AD) ≤ P(BD), si y solo si AD BD, y si y solo si A D B. Entonces
PD (A) = P(A | D).
C = {cij : i ∈ I, j ∈ J}.
c1 ≺ c2 , c1 ∼ c2 , c1 c2 .
{c1 | E, c2 | E 0 }.
Ejemplo: “Si tiro una moneda y sale águila te doy 100 pesos, sino te
doy 0 pesos”. (¿Cómo compararı́a esta consecuencia compuesta con
la consecuencia simple “te doy 50 pesos”?)
{c ∗ | A1 , c∗ | A01 } {c ∗ | A2 , c∗ | A02 }
u(ai , Ej ) = u(cij )
y evitarnos los cij ’s. También se suele usar en algunos contextos una
función de pérdida en vez de utilidad, donde L(ai , Ej ) = −u(ai , Ej ).
es decir
n
X
P(H) = P(Ei )u(a, Ej ).
i=1