Está en la página 1de 7

Solucionario de la Práctica Calificada 3 -

Estadı́stica Bayesiana
Amsthrong Leonardo Salazar Pumapillo1
1
Asignatura: Estadı́stica Bayesiana
2
Escuela Profesional de Ingenierı́a Estadı́stica
3
Universidad Nacional de Ingenierı́a

10/06/2019

Resumen
El presente trabajo muestra la resolución de la PC 3

Solucionario de ejercicios
Problema 1
Pruebe que si L1 y L2 son funciones de perdida proporcionales, i.e.
L1 (δ, θ) = kL2 (δ, θ) con k > 0,
entonces los estimadores de Bayes asociados con estas funciones coinciden.

Solución:

Sean θ̂1 = arg mı́nθ∈Θ {E(L1 (δ, θ))} y θ̂2 = arg mı́nθ∈Θ {E(L2 (δ, θ))} los esti-
madores de Bayes asociadas a las funciones de pérdida L1 y L2 respectivamente.

De dato, L1 y L2 son proporcionales, es decir: L1 (δ, θ) = kL2 (δ, θ), entonces.


θ̂1 = arg mı́n{E(L1 (δ, θ))} = arg mı́n{E(kL2 (δ, θ))},
θ∈Θ θ∈Θ

ahora utilizando la linealidad de la esperanza;

θ̂1 = arg mı́n{E(kL2 (δ, θ))} = arg mı́n{kE(L2 (δ, θ))}.


θ∈Θ θ∈Θ

Utilizando la propiedad: arg mı́nx∈A {f (x)} = arg mı́nx∈A {kf (x)} donde k es
una constante respecto a x.

Regresando al problema: k es constante con respecto de θ, entonces.

θ̂1 = arg mı́n{kE(L2 (δ, θ))} = arg mı́n{E(L2 (δ, θ))} = θ̂2
θ∈Θ θ∈Θ

Vemos que θ̂1 = θ̂2 , por lo tanto los estimadores de Bayes asociados a L1 y L2
coinciden.

1
Problema 2
Un grupo de biólogos están interesados en la proporción de huevos que logran
eclosionar en un nido de Chelonoidis Nigra (tortuga de las Galápagos). De
un nido seleccionado, se marcaron n huevos del nido de manera aleatoria y
posteriormente, se observó que todos los huevos marcados lograron eclosionar
con éxito. Suponiendo una priori invariante por traslación para el parámetro de
interés, se pide lo siguiente:
(a) Obtenga la región de máxima densidad posteriori de 100(1 − α) % para el
parámetro de interés.
(b) Sea ϕ = θ/(1 − θ), donde θ es la probabilidad de que un huevo eclosione.
A partir de la región hallada en (a), pruebe que

P(k/(1 − k) ≤ ϕ|X) = 1 − α

donde k es el limite inferior de la región de credibilidad hallada en (a).


(c) Halle la distribución posteriori de ϕ y esboce un gráfico de esta usando
el criterio de la primera derivada. Luego discuta la forma de la región de
máxima densidad posteriori para ϕ y compárelo con el hallado en (b) ¿Qué
puede concluir?.

Solución:

Xi |θ: i-ésimo huevo de los ”n” marcados del nido que logran eclosionar,
entonces.
iid
Xi |θ ∼ Ber(θ); ∀ i = 1, . . . , n

Donde θ es la probabilidad de que un huevo eclosione, este es el parámetro de


interés,
n
Y n
Y Pn Pn
p(x|θ) = p(xi |θ) = θxi (1 − θ)1−xi = θ i=1 xi
(1 − θ)n− i=1 xi
= Lx (θ)
i=1 i=1

Del dato, usaremos una priori invariante por translación, es decir: p(θ) ∝ 1
Pn Pn
xi
p(θ|x) ∝ p(x|θ)p(θ) ∝ Lx (θ)p(θ) ∝ θ i=1 (1 − θ)n− i=1 xi
×1
Pn Pn
xi
p(θ|x) ∝ θ i=1 (1 − θ)n− i=1 xi
,

veamos que este es el kernel de una Beta, completando los parámetros:

n
X n
X 
θ|x ∼ Beta xi + 1; n − xi + 1
i=1 i=1

2
(a) Sabemos que de los P”n” huevos marcados, todas ellas eclosionan poste-
n
riormente, entonces, i=1 xi = n por lo que la distribución posteriori se
reduce a:
θ|x ∼ Beta(n + 1; 1)
θn+1−1 (1 − θ)1−1
p(θ|x) = , 0≤θ≤1
B(n + 1, 1)
p(θ|x) = (n + 1)θn , 0 ≤ θ ≤ 1

Distribucion Beta(n+1,1) para un "n" dado


10
8
dbeta(x, n + 1, 1)

6
4
2

1−α
P(k|X)
0

k
0.0 0.2 0.4 0.6 0.8 1.0

Figura 1: Sabemos que la región


R de máxima densidad posteriori es aquella donde:
C = {θ : p(θ|x) ≥ p(k|x)} ↔ c p(θ|x)dθ = 1 − α

Ahora de acuerdo a la gráfica p(θ|x) vemos que C = {θ : k ≤ θ ≤ 1, k 6= 0},


donde:
Z Z 1
1 − α = p(θ|x)dθ = (n + 1)θn dθ = θn+1 |1k → k = α1/(n+1)
c k

Por lo tanto la región de máxima densidad posteriori es: C = [α1/(n+1) ; 1]


(b) Sea ϕ = θ/(1 − θ), se pide demostrar P(k/(1 − k) ≤ ϕ|X) = 1 − α
P(k/(1 − k) ≤ ϕ|X) = P(k/(1 − k) ≤ θ/(1 − θ)|X)

luego, en la desigualdad:
1 1
P(k/(1 − k) + 1 − 1 ≤ θ/(1 − θ) + 1 − 1|X) = P( − 1 ≤ − 1|X)
1−k 1−θ
Luego
 
1 1
P 0< ≤ |X = P(1 − θ ≤ 1 − k|X)
1−k 1−θ
P(−θ ≤ k|X) = P(k ≤ θ|X)
Todo esto debido a que k ∈ [0, 1] además k es el limite inferior de la región
de credibilidad, entonces: k/(1 − k) ≤ ϕ ↔ k ≤ θ
→ P(k/(1 − k) ≤ ϕ|X) = P(k ≤ θ) = 1 − α

3
(c) Si ϕ = θ/(1 − θ) → θ = 1 − 1/(ϕ + 1) → dθ
dϕ = (ϕ + 1)−2
 n
dθ ϕ
p(ϕ|X) = p(θ(ϕ)|X) = (n + 1) (ϕ + 1)−2
dϕ ϕ+1
ϕn
p(ϕ|X) = (n + 1) , 0≤ϕ
(ϕ + 1)n+2
ϕ|X ∼ (n + 1)F(2n+2,2)

Esbocemos la gráfica de p(ϕ|x), usando el criterio de la primera derivada:


 n−1
(1 + ϕ)n+2 − ϕn (n + 2)(1 + ϕ)n+1

dp(ϕ|X) nϕ
= (n + 1)
dϕ (1 + ϕ)2n+4
(n + 1)
= (ϕn−1 (1 + ϕ)n+1 (n(1 + ϕ) − (n + 2)ϕ))
(1 + ϕ)2n+4
(n + 1)
= ϕn−1 (n − 2ϕ)
(1 + ϕ)n+3

Veamos que:

dp(ϕ|X) n n
>0→ϕ< , p(ϕ|X) es creciente en [0, ]
dϕ 2 2
dp(ϕ|X) n n
<0→ϕ> , p(ϕ|X) es decreciente en [ , ∞].
dϕ 2 2
n
Entonces en ϕ = 2 = arg máxϕ∈R+ {p(ϕ|X)}, por lo tanto, la gráfica seria:

Distribucion Fisher(2n+2,2) para un "n" dado


0.5
0.4
df(x, 2 * p + 2, 2)

0.3
0.2
P(L|X)

1−α
0.1
0.0

L1 L2
0 1 2 3 4 5

Figura 2: Región de máxima densidad posteriori

4
Donde la región sombreada es la de máxima densidad posteriori para ϕ,
vemos que esta a diferencia de la hallada para θ, genera dos colas en la gráfica,
es decir, es una región con las dos colas en ϕ desconocidas, sin embargo para
θ, con ayuda de la gráfica vimos que una cola ya era conocida, por lo que su
cálculo resultó y resultará mucho más sencillo que para las colas de la región de
máxima densidad posteriori para ϕ

Problema 3
Un laboratorio médico está realizando pruebas de un medicamento para
reducir la presión arterial. Para probar la efectividad del mismo , se decide se-
leccionar aleatoriamente a n pacientes con hipertensión arterial de un hospital
de la ciudad y se les mide la reducción en la presión arterial una vez que se les
haya aplicado el medicamento. Por estudios anteriores, se sabe que la reducción
media de la presión arterial del mejor medicamento en el mercado actual es de
µ0 y las mediciones de la reducción en la presión arterial poseen distribución
normal con varianza conocida. Suponiendo una priori invariante por traslación,
analice la relación entre el p-valor y la probabilidad posteriori de la nula.

Solución:
Xi |θ: Reducción en la presión arterial del paciente i-ésimo luego de aplicar el
nuevo medicamento.
iid
Xi |θ ∼ N (θ, σ02 )
Primero, usamos el enfoque Bayesiano, vemos que θ (reducción media de la
presión arterial después de aplicar el nuevo medicamento) es el parámetro de
interés y la distribución priori para este es, por dato: p(θ) ∝ 1
n n
1 xi −θ 2
(2πσ02 )−1/2 e− 2 (
Y Y
σ0 )
Lx (θ) = p(x|θ) = p(xi |θ) =
i=1 i=1
1
Pn xi −θ 2 1
Pn xi −θ 2
p(θ|X) ∝ Lx (θ)p(θ) ∝ (2πσ02 )−n/2 e− 2 i=1 ( σ0 )
∝ e− 2 i=1 ( σ0 )
.
(1)

Ahora trabajamos en el exponente:


n n n
1 X xi − θ 2 X x2i X xi nθ2
− ( ) =− 2 + θ 2 − 2
2 i=1 σ0 i=1
2σ0 i=1
2σ0 2σ0
n n
n 2 X xi X x2i
=− 2 (θ − 2θ ) −
2σ0 i=1
n i=1
2σ02
n
n 2 2 2
X x2i
=− (θ − 2θx̄ + x̄ − x̄ ) −
2σ02 i=1
2σ02
n
n 2 2
X x2i
=− [(θ − x̄) − x̄ ] −
2σ02 i=1
2σ02
n
n nx̄2 X x2i
=− 2 (θ − x̄)2 + 2 −
2σ0 2σ0 i=1
2σ02

5
Ahora reemplazando en (1):

2  x2
(θ−x̄)2 + nx̄2 −
n
Pn i
− 2 
i=1 2σ 2
p(θ|X) ∝ e 2σ0 2σ0
 0

− 12 ( σ θ−x̄
√ )2
∝e / n
0

Vemos que esto es el Kernel de una normal, entonces completando los paráme-
tros:
θ|X ∼ N (x̄, σ02 /n), de aquı́ planteamos la hipótesis correspondiente al problema.

Se quiere probar que la reducción media de la presión de los pacientes después


de aplicarles el nuevo medicamento (θ) es mayor o igual que el medicamento
actual en el mercado (µ0 ), entonces:
H0 : µ0 ≤ θ v.s H1 : θ < µ0
Con esto hallaremos la probabilidad posteriori de la nula:
P(H0 |X) = P(θ ≥ µ0 |X = x) = 1 − P(θ < µ0 |X = x)
   
θ − x̄ µ0 − x̄ µ0 − x̄
=1−P √ < √ X =x =1−P z< √ X=x
σ0 / n σ0 / n σ0 / n

 
µ0 − x̄
P(H0 |X) = 1 − Φ √ .
σ0 / n

Donde Φ es la función de distribución normal.

Ahora bajo el enfoque frecuentista, hallamos el p-valor mediante los siguientes


pasos
i Planteamiento de la hipótesis: H0 : θ ≥ µ0 v.s H1 : θ < µ0
ii Nivel de significancia: α
iii Estadı́stico de prueba: Como la varianza es conocida y los datos se distri-
buyen normalmente, el estadı́stico de prueba será: z = σ0x̄−θ
√ ∼ N (0, 1)
/ n

iv Criterio de decisión:
Con esto podemos ver que el p-valor, viene dado por:
√0 ) = P(Z < − µ0 −x̄
p − valor = P(Z < Zc ) = P(Z < σx̄−µ √ )
0/ n σ0 / n

µ0 − x̄  µ − x̄ 
p − valor = 1 − P Z < √ =1−Φ 0 √
σ0 / n σ0 / n

esto debido a la simetrı́a de la normal


µ0 − x̄ 
p − valor = 1 − Φ √
σ0 / n

6
0.4
0.3
0.2
P(Z|X)
0.1

1−α
0.0

Z
−3 −2 −1 0 1 2 3

Figura 3: Si Zc cae en la región sombreada, se rechaza H0 , de lo contrario, no


se rechaza, donde Zc = σx̄−µ
√0 y Φ es la función de distribución normal
0/ n

Vemos que matemáticamente los resultados para el p-valor y la probabilidad


posteriori de la nula son iguales, pero esto debido a que se uso una priori inva-
riante por translación, es decir, no se uso información priori del parámetro, por
lo que en este caso tanto el enfoque Bayesiano y el Frecuentista coinciden en
cuanto a la decisión sobre la hipótesis planteada.

También podría gustarte