Está en la página 1de 5

Universidad de Chile — FEN

Departamento de Economı́a

MES 260 — Teorı́a Estadı́stica Profesor: Vı́ctor Martı́nez


Semestre Otoño 2018 Viernes 22 de junio, 2018

Pauta Control No. 4

Instrucciones

1. Tiene 10 minutos para leer el enunciado antes de que se distribuyan los sets de respuestas.

2. Tiene 2 horas para responder las preguntas.

3. El control tiene 3 preguntas, los puntos de cada pregunta se indican al comienzo de ellas.
Exite un bono de 10 puntos, por lo que el número máximo de puntos que puede obtener es
de 98, pero el 7.0 se alcanza con 88 puntos.

4. Todas las partes de una pregunta dan el mismo puntaje.

5. Asigne su tiempo de modo de dedicar suficiente tiempo a todas las preguntas. No dedique
demasiado tiempo a ninguna de ellas. Dedicar un número de minutos igual a los puntos que
da cada pregunta es una buena estrategia. Esto deja 40 minutos de libre disposición.

6. Sus respuestas deben contener pasos intermedios para que el evaluador pueda estar seguro de
que llegó al resultado correcto sabiendo lo que hacı́a. Esto también le permitirá al evaluador
darle puntaje parcial cuando no obtenga la respuesta correcta.

7. Responda cada pregunta en una hoja distinta e indique cuál pregunta está respondiendo.

8. Este es un control a libro cerrado. No se permiten ayudas de ninguna especie.

1
1. [48 puntos] La gerencia de una cadena de supermercados está muy preocupada por los
robos de mercaderı́a. Por esto han decidio testear la efectividad de las horas-guardia sobre la
cantidad de mercaderı́a robada, en base a información histórica. Sea Yit la pérdida por robos
de mercaderı́a (en decenas de miles de pesos) en el supermercado i en el mes t. Sea también
Xit la cantidad de horas-guardia en el supermercado i en el mes t. Para este problema asuma
que los supermercados son idénticos, exceptuando por la cantidad de horas-guardia, que
son decididas exógenamente por la gerencia. Se cuenta con la siguiente información para 2
meses consecutivos en 9 supermercados:

Yt=1 Xt=1 Yt=2 Xt=2 ∆Y ∆X


i=1 100 240 87 250 -13 10
i=2 90 300 120 280 30 -20
i=3 105 260 80 270 -25 10
i=4 95 250 119 210 24 -40
i=5 103 280 115 290 12 10
i=6 107 200 130 190 23 -10
i=7 115 230 124 240 9 10
i=8 80 225 123 220 43 -5
i=9 120 270 82 280 -38 10

a) Calcule la media podada y la media winsorizada, ambas de orden 2, para la pérdida por
robos de mercaderı́a del mes t = 1. Si sabe que los datos no están medidos con error,
¿es útil hacer estadı́stica robusta?
Sol.
La media podada de orden 2 es x p = 102 y la media winsorizada de orden 2 es xw =
101, 6. Si hay certeza de que los datos no están medidos con error no es útil hacer
estadı́stica robusta.

b) Defina Wi = 1 si para el supermercado i el cambio en Y tiene signo contrario al cambio


en X. Por otro lado, defina Wi = 0 si ambos cambios tienen el mismo signo. ¿Qué valor
de Wi presenta evidencia a favor de que los guardias son efectivos en el supermercado
i?
Sol.
Cuando Wi = 1 es evidencia de que los guardias son efectivos, ya que bajan (suben) las
pérdidas cuando suben (bajan) las horas-guardia.

c) Suponga que bajo H0 las horas-guardia no son efectivas para disminuir los robos de
mercaderı́a y que interesan desviaciones de H0 que apuntan a que las horas-guardia
disminuyen las pérdidas por robos. Muestre que T = ∑9i=1 Wi sirve como estadı́stico de
prueba para testear la nula anterior.
Sol.

2
Bajo H0 , T tiene una distribución binominal con parámetros n = 9 y p = 1/2. Además,
valores altos de tobs presentan evidencia a favor del tipo de desviaciones en las que
estamos interesados. Por lo tanto, T sirve como estadı́stico de prueba.

d) Calcule el valor observado del estadı́stico de prueba tobs . Deje planteada una expresión
para calcular el valor-p de este test que se calcuları́a directamente con calculadora.
Sol.
El valor observado de T es igual a tobs = 7. Luego el valor-p es:
   x  9−x  9 9  
9
9 1 1 1 9
valor-p = Pr(T ≥ tobs ) = Pr(T ≥ 7) = ∑ = ∑
x=7 x 2 2 2 x=7 x

e) Calcule el valor-p aproximado utilizando una aproximación adecuada. Concluya.


Sol.
Bajo H0 se tiene que E(T ) = np = 9 · 0, 5 = 4, 5 y Var(T ) = np(1 − p) = 9 · 0, 5 · 0, 5 =
2, 25. Utilizando la aproximación normal:
 
7 − 4, 5
Pr(T ≥ 7) = Pr Z ≥ √ = 1 − Φ(1, 67) = 0, 0475
2, 25
Por lo que hay contundente evidencia en contra de H0 .

f ) Olvı́dese del estadı́stico de prueba anterior y considere ahora el siguiente estadı́stico:

D = (Y t=2 |∆X < 0) − (Y t=2 |∆X > 0)

Donde (Y t=2 |∆X < 0) denota la media de pérdidas en el segundo mes para aquellos
supermercados donde disminuyeron las horas-guardia y (Y t=2 |∆X > 0) denota la media
de pérdidas en el segundo mes para aquellos supermercados donde aumentaron las
horas-guardia. Utilizando TCL y las propiedades de las distribuciones normales, ¿cuál
es la distribución de D bajo H0 ? (Recuerde que los supermercados son idénticos excepto
por el número de horas-guardia decididas exógenamente por la gerencia)
Sol.
Bajo H0 todos los Yi2 son i.i.d con media µ y varianza σ2 . Por lo tanto, por TCL
(Y t=2 |∆X < 0) tiene una distribución aproximadamente normal con media µ y varian-
za σ2 /4. Su parte, (Y t=2 |∆X > 0) tiene una distribución aproximadamente normal con
media µ y varianza σ2 /5. Por suma (resta) de normales, la distribución aproximada
de D bajo H0 es normal con media 0 y varianza ( 14 + 15 )σ2 = 20 9 2
σ . No es necesario
calcular la suma de fracciones en esta parte.

g) Muestre que D sirve como estadı́stico de prueba para testear H0 y calcule su valor
observado dobs . Para esto considere que (Y t=2 |∆X < 0) = 123 y (Y t=2 |∆X > 0) = 97, 6.

3
Sol.
9 2
Bajo H0 la distribución de D es aproximadamente normal con media 0 y varianza 20 σ .
Además, valores grandes de D indican que las pérdidas son considerablemente mayores
cuando bajan las horas-guardia. Esto es evidencia de desviaciones de H0 que apuntan
a que las horas-guardia disminuyen las pérdidas por robos. Por lo tanto D sirve como
estadı́stico de prueba y su valor observado es igual a dobs = 123 − 97, 6 = 25, 4.

h) Estimando la varianza de Yt=2 , encuentre el valor-p y concluya. Para esto considere


que la desviación
p estándar muestral de Yt=2 es aproximadamente 19, 9. Podrı́a serle de
utilidad que 9/20 = 0, 67. Aproxime a la centésima.
Sol.
!
25, 4 − 0
valor-p = Pr(D ≥ dobs ) = Pr(D ≥ 25, 4) = Pr Z ≥ p
9/20 · 19, 9
= 1 − Φ(1, 91) = 1 − 0, 972 = 0, 028
La evidencia en contra de H0 es contundente.

2. [20 puntos] Sea X1 , X2 , ..., Xn una muestra aleatoria de distribución común Poisson con
parámetro λ desconocido. Se desea testear las siguiente hipótesis:

H0 : λ = 1/4

H1 : λ = 1/2
Recuerde que el valor esperado y la varianza de una distribución de Poisson son ambos
iguales a λ.

a) Muestre que el valor de α0 + α1 se minimiza con un test que rechaza H0 cuando X n > c
y exprese el valor de c.
Sol.
Invocamos la versión simétrica del Teorema de Neyman-Pearson para encontrar M0 :
n
exp(−n/4)(1/4)∑i=1 xi
f0 (x) k1 ∏ni=1 xi !
> ⇐⇒ n >1
f1 (x) k0 exp(−n/2)(1/2)∑i=1 xi
∏ni=1 xi !
n
⇐⇒ exp(n/4)(1/2)∑i=1 xi > 1
n
n
⇐⇒ − ln(2) ∑ xi > 0
4 i=1
1
⇐⇒ X n >
4 ln(2)

4
b) Suponga que n = 20. Use el TCL y la tabla con la cumulativa de la normal estándar
para calcular los valores dep
α0 y α1 para el p
test óptimo que encontró en a). Para esto
considere que ln(2) = 0, 7, 1/80 = 0, 1 y 1/40 = 0, 16 y aproxime sus resultados
a la centésima.
Sol.
Con los datos entregados tenemos que el test óptimo rechaza H0 cuando X n > 0, 36. En
efecto,
!
0, 36 − 0, 25
α0 = Pr(Aceptar H1 |H0 ) = Pr(X n > 0, 36|λ = 1/4) = Pr Z > p = 1−Φ(1, 1) = 0, 14
0, 25/20
!
0, 36 − 0, 5
α1 = Pr(Aceptar H0 |H1 ) = Pr(X n < 0, 36|λ = 1/2) = Pr Z < p = Φ(−0, 88) = 0, 19
0, 5/20
3. [20 puntos + Bono] Se dispone de UNA observación de una variable aleatoria que bajo H0
es uniforme en el intervalo [0,1] y bajo H1 proviene de una exponencial con β = 2.
a) De todos los test que poseen error de tipo I igual a 0, 05, encuentre el test que minimiza
el error de tipo II. Puede encontrar la solución gráfica o matemáticamente.
Sol.
Partamos por notar que H0 es imposible si x > 1. Por lo tanto (1, ∞) ∈ R . Luego, para
x ∈ [0, 1], la versión asimétrica del Teorema de Neyman-Pearson nos dice que el test
que minimiza un error cuando se fija el otro es aquel que rechaza H0 cuando:

f1 (x)
> k ⇐⇒ 2e−2x > k ⇐⇒ x < c
f0 (x)

Luego, encontramos c tal que el test tenga error tipo I igual a 0,05.
Z c
α = 0, 05 = Pr(Rechazar H0 |H0 ) = Pr(x < c|X ∼ U[0, 1]) = 1dx = c
0

Por lo tanto c = 0, 05 y la región de rechazo del test óptimo es R = [0; 0,05) ∪ (1, ∞).
b) Calcule la probabilidad del error de tipo II del test que obtuvo en la parte a).
Sol.

Z 1
β = Pr(No rechazar H0 |H1 ) = Pr(0, 05 < x < 1|X ∼ exp(2)) = 2e−2x dx
0,05

c) [Bono de 10 puntos] Encuentre el test que minimiza α0 + 10 α1 . Para esto considere


que ln(20) ≈ 3. Al concluir tenga presente cuál es el dominio de X bajo H0 .

También podría gustarte