Está en la página 1de 18

Universidad de Chile — Facultad de Economı́a y Negocios

ENMES 255 — Estadı́stica II Todas las secciones


Semestre Primavera 2022 Sábado, 26 de noviembre, 2022

Pauta de Examen

Instrucciones

1. Tiene 10 minutos para leer el enunciado del examen antes de que se distribuyan los sets de
respuestas.

2. Este examen consta de 6 preguntas con un máximo de 135 puntos.

3. Salvo que se indique explı́citamente lo contrario, todas las partes de una pregunta dan el
mismo puntaje.

4. Tiene 2 horas y 45 minutos para responder el examen.

5. Asigne su tiempo de modo de dedicar suficiente tiempo a todas las preguntas. No dedique
demasiado tiempo a ninguna de ellas. Si asigna el mismo número de minutos que los puntos
que da cada pregunta, tendrá 30 minutos de libre disposición.

6. Sus respuestas deben contener todos los pasos intermedios para que el evaluador pueda estar
seguro de que llegó al resultado correcto sabiendo lo que hacı́a. Esto también le permitir’a al
evaluador darle puntaje parcial cuando no obtenga la respuesta correcta.

7. Responda cada pregunta en una hoja distinta e indique cuál pregunta está respondiendo.

8. Este es un examen a libro cerrado. No se permiten ayudas de ninguna especie, solo puede
usar el resumen oficial que se le entregó al comienzo.

1
1. Definiciones, independencia y covarianza (20 puntos)
X1 y X2 son variables aleatorias Bernoulli, con probabilidad de éxito 1/2, independientes.

(a) Determine la función de probabilidad conjunta de X1 y X2 .


(b) Defina Z = X1 + X2 y W = X1 − X2 . Encuentre la función de probabilidad de Z y la
función de probabilidad de W .
(c) Calcule Pr(Z = 1, W = 1). Use este resultado para mostrar que Z y W no son inde-
pendientes.
(d) Usando las propiedades de la covarianza, calcule Cov(Z, W ).
(e) ¿Existe una contradicción entre los resultados que obtuvo en (c) y (d)? Justifique su
respuesta.

Solución:

(a) Como X1 y X2 son independientes, se tiene que:

1 1 1
Pr(X1 = 0, X2 = 0) = Pr(X1 = 0) Pr(X2 = 0) = · =
2 2 4
1 1 1
Pr(X1 = 0, X2 = 1) = Pr(X1 = 0) Pr(X2 = 1) = · =
2 2 4
1 1 1
Pr(X1 = 1, X2 = 0) = Pr(X1 = 1) Pr(X2 = 0) = · =
2 2 4
1 1 1
Pr(X1 = 1, X2 = 1) = Pr(X1 = 1) Pr(X2 = 1) = · =
2 2 4
(b) Veamos primero la f.p. de Z: Z puede tomar los valores 0, 1 y 2. Luego,

1
Pr(Z = 0) = Pr(X1 = 0, X2 = 0) =
4
1
Pr(Z = 1) = Pr(X1 = 0, X2 = 1) + Pr(X1 = 1, X2 = 0) =
2
1
Pr(Z = 2) = Pr(X1 = 1, X2 = 1) =
4

Ahora la f.p de W : W puede tomar los valores -1, 0 y 1. Luego,

1
Pr(W = −1) = Pr(X1 = 0, X2 = 1) =
4
1
Pr(W = 0) = Pr(X1 = 0, X2 = 0) + Pr(X1 = 1, X2 = 1) =
2
1
Pr(W = 1) = Pr(X1 = 1, X2 = 0) =
4

(c) Tenemos que como el evento (Z = 1, W = 1) es igual al evento (X1 +X2 = 1, X1 −X2 = 1)
que a su vez equivale a (X1 = 1, X2 = 0),

2
1
Pr(Z = 1, W = 1) = Pr(X1 = 1, X2 = 0) =
4
Vemos que Pr(Z = 1, W = 1) ̸= Pr(Z = 1) Pr(W = 1), ya que la primera expresión
1 1
es igual a 4 mientras que la segunda expresión es igual a 8. Luego, Z y W no son
independientes.
(d) Usando las propiedades de la covarianza:

Cov(Z, W ) = Cov(X1 + X2 , X1 − X2 )
= Cov(X1 , X1 ) + Cov(X1 , −X2 ) + Cov(X2 , X1 ) + Cov(X2 , −X2 )
= Cov(X1 , X1 ) − Cov(X1 , X2 ) + Cov(X1 , X2 ) − Cov(X2 , X2 )
= Var(X1 ) − Var(X2 )
=0

ya que X1 y X2 son ambas Bernoulli con probabilidad de éxito 1/2, y por lo tanto tienen
la misma varianza (que es igual a 1/4).
(e) No hay contradicción. Como vimos en clases, dos variables aleatorias que no son inde-
pendientes pueden tener una covarianza igual a cero (por ejemplo, en el caso en que la
dependencia entre ellas sea no lineal) o distinta de cero. Lo que también vimos es que
si dos variables aleatorias son independientes, entonces su covarianza es igual a cero.

Rúbrica:

(a) 4 ptos. en total. 1 punto por cada una de las 4 probabilidades correctas, siempre y
cuando el estudiante demuestre que todas se calculan como el producto de las probabili-
dades marginales. Más de algún estudiante podrı́a optar por realizar una tabla de doble
entrada, con las probabilidades conjuntas en su interior. Esto está correcto en la medida
que el soporte y las probabiliades estén correctos y claramente identificados.
(b) 4 ptos. en total.
ˆ 1 punto por identificar correctamente el soporte de Z.
ˆ 0,25 punto por identificar correctamente la probabilidad de Z = 0.
ˆ 0,5 punto por calcular correctamente la probabilidad de Z = 1.
ˆ 0,25 punto por identificar correctamente la probabilidad de Z = 2.
ˆ 1 punto por identificar correctamente el soporte de W .
ˆ 0,25 punto por identificar correctamente la probabilidad de W = −1.
ˆ 0,5 punto por calcular correctamente la probabilidad de W = 0.
ˆ 0,25 punto por identificar correctamente la probabilidad de W = 1.
(c) 4 ptos. en total:

3
ˆ 1 punto por notar la equivalencia de los eventos.
ˆ 1 punto por notar que esta probabilidad vale 1/4.
ˆ 1 punto por notar que la probabilidad conjunta no es igual al producto de las
marginales (debe notar que el producto de las marginales vale 1/8).
ˆ 1 punto por concluir que no son independientes.
(d) 4 ptos. en total:
ˆ 1 punto por ocupar correctamente la “distributividad” de la covarianza.
ˆ 1 punto por sacar los -1 de la covarianza.
ˆ 0,5 punto por ocupar correctamente la “conmutatividad” de la covarianza.
ˆ 1 punto por ocupar correctamente que la covarianza de una v.a. consigo misma es
igual a su varianza.
ˆ 0,5 punto por notar que las varianzas son iguales, y que por lo tanto la covarianza
pedida es igual a cero (solo si hizo correctamente todos los pasos anteriores). No es
necesario que noten que la varianza de ambas v.a. es igual a 1/4.
(e) 4 puntos por decir que no hay contradicción porque covarianza igual a cero no implica
necesariamente independencia. Es directo, por lo que no darı́a puntaje intermedio.

2. Los clientes de un banco (20 puntos)


Suponga que la cantidad de clientes que llegan a un banco durante un dı́a hábil se pueden
modelar con una distribución de Poisson de parámetro θ > 0 desconocido. Los analistas del
banco poseen una base de datos con los clientes que han llegado al banco durante los últimos
250 dı́as hábiles en que el banco ha atendido público, y desean estimar θ mediante métodos
bayesianos.

(a) Una primera analista, antes de mirar los datos, asegura que jamás han llegado menos de
50 clientes al dı́a, por lo que decide ocupar una previa que tiene densidad positiva solo
para θ > 50. ¿Puede la analista asegurar que su estimador bayesiano será consistente?
¿Por qué sı́ o por qué no?
P250
Suponga además que en la base de datos se observa que i=1 xi =50.000, donde xi corre-
sponde al número de clientes que se observa en el i-ésimo dı́a.

(b) Encuentre la función de verosimilitud para estos datos.


(c) Una segunda analista decide estimar θ utilizando una previa impropia dada por π(θ) = 1
para θ ∈ (0, ∞). Concluya que la posterior es un distribución Gamma. Identifique sus
parámetros y encuentre el estimador de Bayes para este caso.

4
(d) Una tercera analista decide estimar θ ocupando el modelo Poisson-Gamma con una
previa Gamma de parámetros α = 64 y β = 1/4. Encuentre el estimador de Bayes para
este caso.

Solución:

(a) Podemos notar que este analista no está cumpliendo con la Regla de Cromwell, por lo
que su estimador solo será consistente si el valor verdadero de θ es mayor que 50.
(b) Como vimos en clases, la función de verosimilitud en este caso será:

e−θ θx1 e−θ θx2 e−θ θxn P


L(θ; x) = f (x|θ) = · · ... · ∝ e−nθ θ xi = e−250θ θ5000
x1 ! x2 ! xn !
(c) En este caso tenemos que π(θ) = 1 para θ > 0. Luego,
P
π(θ|x) ∝ L(θ; x) · π(θ) ∝ e−nθ θ xi

Por inspección, podemos notar que la posterior corresponderá a la distribución Gamma


P
de parámetros α = xi + 1 y β = n. Luego, el estimador bayesiano será:

α 50001
θb = E(θ|x) = =
β 250

(d) Tenemos que en este caso la previa es Gamma(64,1/4), por lo que la posterior será
Gamma(64+50.000, 1/4+250). Luego, el estimador bayesiano será:

α 50064
θb = E(θ|x) = =
β 250, 25

Rúbrica:

(a) 5 ptos por dar el argumento completo: 2,5 ptos por mencionar que la previa no cumple
la Regla de Cromwell y 2,5 ptos por mencionar bajo qué condiciones el estimador será
consistente bajo esta previa. Dar puntaje parcial, 2,5 ptos, si menciona la regla de Regla
de Cromwell directamente o indirectamente (definiéndola con palabras), pero no entrega
una respuesta completa.
(b) 5 ptos por llegar a la expresión correcta. Notar que en la pauta hay tres expresiones
para la verosimilitud: una con igualdad y dos proporcionales. Si el estudiante llega a
cualquiera de la tres dar puntaje completo. Descontar 1 punto si llega a la verosimilitud
correcta y luego calcula el log de la verosimilitud (que no se pedı́a). Dar puntaje parcial,
2 ptos, por soluciones donde el estudiante parte de la idea correcta, pero se equivoca en
el álgebra.
(c) 5 ptos en total.

5
ˆ 2 ptos por dar el argumento correcto que la posterior es una gamma.
ˆ 1 pto por encontrar el primer parámetro de la posterior.
ˆ 1 pto por encontrar el segundo parámetro de la posterior
ˆ 1 pto por encontrar el estimador de Bayes.
(d) 5 ptos en total. Notar que como solo se pide el estimador de Bayes, el estudiante puede
poner directamente el estimador correcto saltándose los pasos intermedios. En este caso
dar 5 ptos. Si el estudiante concluye un estimador incorrecto sin poner pasos intermedios
dar 0 ptos. Para dar puntaje parcial:
ˆ 2 ptos por dar el argumento correcto que la posterior es una gamma (decir según el
formulario está ok).
ˆ 1 pto por encontrar el primer parámetro de la posterior.
ˆ 1 pto por encontrar el segundo parámetro de la posterior
ˆ 1 pto por encontrar el estimador de Bayes.

3. Los argumentos de Elon Musk para retractarse de comprar Twitter (15 puntos)

El 14 de abril de 2022, Elon Musk hizo una oferta no solicitada para adquirir Twitter en 44
mil millones de dólares. La oferta fue aceptada por la empresa el 25 de abril. Sin embargo,
en julio Musk recurrió a tribunales con la intención de retractarse del compromiso que habı́a
adquirido para comprar Twitter. Uno de los argumentos que dieron los abogados de Musk
fue el siguiente:

“En una reunión con ejecutivos de Twitter que se llevó a cabo el 6 de mayo, Musk
se enteró con asombro cuán pobre era el proceso con que Twitter determinaba el
número de cuentas falsas. Analistas [...] elegı́an una muestra aleatoria diaria de
100 cuentas (menos del 0,00005% de los usuarios diarios) [...] para concluir que en
cada trimestre menos del 5% de los usuarios [...] eran falsos”.

A continuación puede suponer que es cierto que de más de 200 millones de usuarios diarios,
Twitter solo determinaba el número de cuentas falsas en una muestra aleatoria (con reem-
plazo, para simplificar su análisis) de 100 usuarios, es decir, una muestra de 100·90=9000
usuarios trimestrales.

(a) ¿Cuál es el error conceptual en el argumento de Musk?


(b) Obtenga una cota superior para el margen de error de la estimación de la fracción
de cuentas falsas trimestrales, es decir, para e en el intervalo de confianza del 95%
[x − e, x + e], donde x es la fracción de cuentas falsas detectadas durante el trimestre.
(c) Suponga que la fracción de cuentas falsas estimada por Twitter en un trimestre deter-
minado fue 4%. La cota obtenida en (b), ¿es una buena aproximación de la precisión de

6
la estimación? Si es ası́, explique por qué; en caso contrario obtenga una expresión más
precisa para e. No es necesario que calcule la expresión, basta con que se pueda calcular
fácilmente usando Excel o Python.

Solución

(a) La precisión de la estimación de la media poblacional depende del tamaño de la muestra,


no de qué porcentaje de la población objetivo incluye la muestra.
(b) Por lo visto en clases (e incluido en el formulario),

1 1 1
e≃ √ = √ = ≃ 0, 01.
n 9000 95

(c) Tenemos σ
b= 0, 04 · 0, 96 ≃ 0, 2, de modo que

2b
σ 0, 4
e≃ √ = √ =≃ 0, 004.
n 9000

La reducción del largo del intervalo (y la mejora de la precisión) es de un 60%.

Rúbrica:

(a) 5 puntos por mencionar que lo relevante en este caso (muestra aleatoria con reemplazo)
es el tamaño de la muestra, no a que porcentaje corresponde de la población total.
No hay puntaje parcial en este caso. Si las estudiantes mencionan que el porcentaje
entrevistado es bajo, pero dan otro argumento para explicar el error de Musk, el puntaje
es 0.
(b) 5 puntos por usar correctamente la fórmula, indicando que esta fórmula es el caso más
conservador (asume valor cercano al 50% para la media muestral), restar 1 punto si no
menciona lo de 50%. Dar 5 puntos si usa la formula de la parte c) de forma correcta. Si
sólo escribe la fórmula, sin reemplazar n, dar 2 puntos.
(c) 5 ptos. en total:
ˆ 2 puntos por mencionar que la información de cuentas falsas implica que no se debe
utilizar el supuesto más conservador o promedio muestral cercano al 50%.
ˆ 2 puntos por usar fórmula correcta con desviación estandar corregida
ˆ 1 puntos por mencionar la mejora en precisión.

4. Regresión de Poisson (30 puntos)

El modelo de regresión lineal simple que vimos en el curso, donde Yi condicional en Xi = xi es


normal con esperanza lineal en xi , es uno de los modelos más importantes en estadı́stica. Sin
embargo, suponer que los Yi siguen una distribución normal no es un buen supuesto cuando

7
los Yi toman valores enteros positivos. En ese caso parece más razonable suponer que los
Yi siguen una distribución de Poisson. El modelo que resulta introduciendo este cambio se
conoce como regresión de Poisson. Eso sı́, las habilidades que se evalúan a continuación
son similares a las desarrolladas cuando cubrimos la regresión lineal simple.
Al igual que en el modelo de regresión simple, los datos son (x1 , y1 ), (x2 , y2 ), ..., (xn , yn )
y el análisis asume que los yi son realizaciones de variables aleatorias Yi cuya distribución
depende de los xi observados. Cuando vimos el caso particular de regresión lineal en que la
recta pasa por el origen, supusimos que los Yi eran normales independientes con esperanza
θxi y varianza σ 2 . A continuación también suponemos que son independientes pero ahora la
distribución de los Yi es Poisson con parámetro θxi . Además suponemos que todos los xi son
estrictamente positivos. El parámetro que se desea estimar es la pendiente de la recta, θ.

(a) Exprese E(Yi |Xi = xi ) y Var(Yi ]Xi = xi ) en función de θ y xi .


(b) ¿En cuál de los casos siguientes es más pertinente el modelo de regresión de Poisson que
la regresión lineal simple que vimos en clases? Justifique.
i. yi es la altura de la hija; xi la altura de la madre.
ii. yi es el número de nuevas empresas creadas en Chile en un año; xi el precio del
cobre ese año.
iii. yi es la variación porcentual del precio de una acción determinada; xi la variación
del ı́ndice accionario correspondiente.

Se puede mostrar (no es necesario que lo haga) que el estimador de máxima-verosimilitud de


θ es !−1
n
X n
X
θbEMV = xi · Yi .
i=1 i=1

Indicación: En lo que sigue, las esperanzas y varianzas que se solicitan son condicionales
en los valores (x1 , x2 , ..., xn ). Por simplicidad, puede omitir el argumento condicional en la
notación de su respuesta.

(c) Muestre que θbEMV es un estimador insesgado de θ. En su derivación debe indicar cada
vez que usa una propiedad de la esperanza y cuál es la propiedad que utilizó.
(d) Exprese la varianza y error cuadrático medio de θbEMV en función de los xi y θ. En
su derivación debe indicar cada vez que usa una propiedad de la varianza y cuál es la
propiedad que utilizó.

Un estimador alternativo de θ es el que derivamos cuando vimos regresión simple:

n
!−1 n
X X
θbRS = x2i · xi Yi .
i=1 i=1

8
(e) Repita las partes (c) y (d) con θbRS en lugar de θbEMV .
(f) Determine la condición que deben cumplir los xi para que el ECM de θbEMV sea menor
que el ECM de θbRS . No es necesario que haga la demostración, pero le contamos que
esta condición se cumple siempre (a menos que todos los xi sean iguales en cuyo caso
los dos ECM son iguales).

Solución

(a) Tenemos
E(Yi ) = Var(Yi ) = θxi .

(b) La aplicación con el número de nuevas empresas, ya que solo en esa aplicación los yi
toman valores enteros positivos.
(c) Tenemos:
 !−1 
n
X n
X
E(θbEMV ) = E  xi · Yi  Definición de θbEMV .
i=1 i=1
n
!−1 " n
#
X X
= xi E Yi E[aX] = aE[X].
i=1 i=1
n
!−1 n
X X
= xi · E [Yi ] E[X + Y ] = E[X] + E[Y ].
i=1 i=1
n
!−1 n
X X
= xi · θxi E[Yi ] = θxi
i=1 i=1
n
!−1 n
!
X X
= xi ·θ· xi
i=1 i=1

= θ.

Como E(θbEMV ) = θ, concluimos que E(θbEMV ) es insesgado.


(d) Tenemos:

9
 !−1 
n
X n
X
Var(θbEMV ) = Var  xi · Yi  Definición de θbEMV .
i=1 i=1
n
!−2 " n
#
X X
= xi Var Yi Var[aX] = a2 Var[X].
i=1 i=1
n
!−2 n
X X
= xi · Var [Yi ] X,Y indep. ⇒ Var[X + Y ] = Var[X] + Var[Y ].
i=1 i=1
n
!−2 n
X X
= xi · θxi Var[Yi ] = θxi
i=1 i=1
n
!−2 n
!
X X
= xi ·θ· xi
i=1 i=1
n
!−1
X
= xi θ.
i=1

Como el estimador es insesgado, el ECM será igual a la varianza.


(e) Tenemos:
 !−1 
n
X n
X
E(θbRS ) = E  x2i · xi Yi  Definición de θbRS .
i=1 i=1
n
!−1 " n #
X X
= x2i E x i Yi E[aX] = aE[X].
i=1 i=1
n
!−1 n
X X
= x2i · E [xi Yi ] E[X + Y ] = E[X] + E[Y ].
i=1 i=1
n
!−1 n
X X
= x2i · xi E [Yi ] E[aX] = aE[X].
i=1 i=1
n
!−1 n
X X
= x2i · xi (θxi ) E[Yi ] = θxi
i=1 i=1
n
!−1 n
!
X X
= x2i ·θ· x2i
i=1 i=1

= θ.

Como E(θbRS ) = θ, concluimos que E(θbRS ) es insesgado.

10
Tenemos:
 !−1 
n
X n
X
Var(θbRS ) = Var  x2i · xi Yi  Definición de θbRS .
i=1 i=1
n
!−2 " n
#
X X
= x2i Var xi Yi Var[aX] = a2 Var[X].
i=1 i=1
n
!−2 n
X X
= x2i · Var [xi Yi ] X,Y indep. ⇒ Var[X + Y ] = Var[X] + Var[Y ].
i=1 i=1
n
!−2 n
X X
= x2i · x2i Var [Yi ] Var[aX] = a2 Var[X].
i=1 i=1
n
!−2 n
X X
= x2i · θx3i Var[Yi ] = θxi
i=1 i=1
n
!−2 n
!
X X
= x2i ·θ· x3i
i=1 i=1
Pn 3
i=1 xi
=  θ.
2 2
Pn
i=1 xi

Como el estimador es insesgado, su ECM será igual a la varianza.


(f) Se debe cumplir

ECM(θ; θbEMV ) < Var(θ; θbRS ) ⇐⇒ Var(θbEMV ) < Var(θbRS ) ⇐⇒

n
!−1 Pn n
!2 n
! n
!
X x3 X X X
⇐⇒ xi θ. < Pni=1 i2 θ ⇐⇒ x2i < x3i · xi .
2
i=1 i=1 xi i=1 i=1 i=1

Para su educación, que la desigualdad anterior se cumple es consecuencia de la Desigual-


dad de Cauchy-Schwarz, según la cual
X X X
( ui vi )2 ≤ ( u2i )( vi2 )

3/2
con desigualdad estricta si los ui no son un múltiplo de los vi . Se aplica con ui = xi ,
1/2
vi = xi .

Rúbrica:

(a) 5 ptos en total.


ˆ 2,5 ptos por la esperanza.
ˆ 2,5 ptos por la varianza.
(b) 5 ptos en total.

11
ˆ 1,5 ptos por justificar que el caso i. no es pertinente.
ˆ 2 ptos por justificar que el caso ii. es pertinente.
ˆ 1,5 ptos por justificar que el caso iii. no es pertinente.
(c) 5 ptos en total.
ˆ 1 pto. si el estudiante dice (o escribe la condición) que un estimador de θ es insesgado
si su esparanza es igual a θ.
ˆ 1 pto. por tomar esperanza a la expresión (estimador) correcta.
ˆ 1 pto. por uso correcto de propiedad E(aX) = aE(X).
ˆ 1 pto. por uso correcto de propiedad E(X + Y ) = E(X) + E(Y ).
ˆ 0,5 pto por el uso de la esperanza de la Possion: E(Yi ) = θxi .
ˆ 0,5 ptos por concluir que es insesgado.
(d) 5 ptos en total.
ˆ 1 pto por indicar que como es insesgado, la varianza y ECM coinciden.
ˆ 1 pto. por tomar varianza a la expresión (estimador) correcta.
ˆ 1 pto. por uso correcto de propiedad Var(aX) = a2 Var(X).
ˆ 1 pto. por uso correcto de propiedad: X e Y independintes, entonces Var(X + Y ) =
Var(X) + Var(Y ).
ˆ 0,5 pto por el uso de la varianza de la Possion: Var(Yi ) = θxi .
ˆ 0,5 ptos por concluir con la expresión de la varianza. Si no simplifica, pero llega a
lo correcto, dar el puntaje.
(e) 5 ptos. en total. 2,5 ptos para la esperanza
ˆ 0,5 pto. por tomar esperanza a la expresión (estimador) correcta.
ˆ 0,5 pto. por uso correcto de propiedad E(aX) = aE(X).
ˆ 0,5 pto. por uso correcto de propiedad E(X + Y ) = E(X) + E(Y ).
ˆ 0,5 pto. por nuevamente uso correcto de propiedad E(aX) = aE(X).
ˆ 0,25 pto por el uso de la esperanza de la Possion: E(Yi ) = θxi .
ˆ 0,25 ptos por concluir que es insesgado.
Y 2,5 ptos para la varianza (ECM).
ˆ 0,5 pto por indicar que como es insesgado, la varianza y ECM coinciden.
ˆ 0,25 pto. por tomar varianza a la expresión (estimador) correcta.
ˆ 0,25 pto. por uso correcto de propiedad Var(aX) = a2 Var(X).
ˆ 0,5 pto. por uso correcto de propiedad: X e Y independintes, entonces Var(X +Y ) =
Var(X) + Var(Y ).
ˆ 0,25 pto. por nuevamente uso correcto de propiedad Var(aX) = a2 Var(X).
ˆ 0,25 pto por el uso de la varianza de la Possion: Var(Yi ) = θxi .

12
ˆ 0,25 ptos por concluir con la expresión de la varianza. Si no simplifica, pero llega a
lo correcto, dar el puntaje.
(f) 5 ptos. por llegar a la condición solicitada. Dar puntaje parcial por partir de la idea
correcta, pero no llegar a lo socilicitado: dar 1,5 ptos. si parten reemplazando los ECM
que encontraron en las partes previas (independinte de si son correctos o no) en la
condición (desigualdad) solicitada en el enunaciado.

5. Determinando el tamaño de la muestra estratificada (30 puntos)

Un canal deportivo realiza una encuesta para estimar la fracción de sus clientes que están
dispuestos a pagar el doble por un servicio premium que está considerando ofrecer.
El canal divide a sus 800 mil clientes en dos grupos. El primer grupo, de 400 mil clientes, se
conecta durante muchas horas cada semana. El segundo grupo, también de 400 mil clientes,
se conecta mucho menos.
Estimaciones preliminares, basadas en una encuesta piloto, indican que aproximadamente el
80% de los clientes del primer grupo y solo alrededor del 20% del segundo grupo estarı́an
interesados en pagar el doble por un servicio premium.
Tres analistas contratadas por el canal proponen estrategias distintas para construir la mues-
tra definitiva. La analista A propone obtener una muestra aleatoria simple, de tamaño
2500. La analista B propone obtener una muestra aleatoria estratificada de tamaño 1600, con
tamaños muestrales proporcionales al tamaño de los estratos. La analista C propone obtener
una muestra aleatoria estratificada de tamaño 1600, con tamaños muestrales óptimos. Las
tres estrategias consideran muestras con reemplazo.

(a) Use la información disponible de la encuesta piloto para obtener estimadores razonables
para la media y varianza de la población objetivo, µ y σ 2 .
(b) Use la información disponible para aproximar la esperanza y varianza del estimador de
la media poblacional asociado a la estrategia de A. Obtenga un valor aproximado para
el ECM asociado a esta estrategia.
(c) Análogo a (a) pero para la analista B.
(d) Análogo a (a) pero para la analista C.
(e) Use (a) y (b) para explicar por qué la estrategia de la analista B es mejor que la estrategia
de la analista A.
(f) Use (b) y (c) para concluir que las estrategias de las analistas B y C son igual de
buenas. ¿Por qué la estrategia que asigna los tamaños de las muestras de cada estrato
óptimamente no reduce el ECM comparado con la estrategia que los asigna de manera
proporcional?

13
Indicación: Usando el subı́ndice 1 para el estrato de alta demanda y el 2 para el de baja
demanda, obtenga buenas aproximaciones para las medias y varianzas poblacionales de cada
estrato, es decir, para µ1 , µ2 , σ12 y σ22 . Luego use la información disponible para obtener
buenas aproximaciones para la fracción de clientes interesados en un servicio premium, µ y la
varianza poblacional de esta fracción, σ 2 . Finalmente, aproxime σ 2 y σ 2 . Toda la información
anterior será necesaria para responder las preguntas.

Solución

Tenemos:

ˆ w1 = w2 = 0, 5.
ˆ µ1 ≃ 0, 8; w2 ≃ 0, 2.
ˆ σ12 ≃ 0, 8 · (1 − 0, 8) = 0, 16; σ22 ≃ 0, 2 · (1 − 0, 2) = 0, 16.
√ √
ˆ σ1 ≃ 0, 16 = 0, 4; σ2 ≃ 0, 16 = 0, 4.

Luego:

µ = w1 µ1 + w2 µ2 ≃ 0, 5 · 0, 8 + 0, 5 · 0, 2 = 0, 5.
σ 2 = w1 σ12 + w2 σ22 ≃ 0, 5 · 0, 16 + 0, 5 · 0, 16 = 0, 16.
σ = w1 σ1 + w2 σ2 ≃ 0, 5 · 0, 4 + 0, 5 · 0, 4 = 0, 4.
σ 2 = σ 2 + w1 (µ1 − µ)2 + w2 (µ2 − µ)2 ≃ 0, 16 + 0, 5 · 0, 32 + 0, 5 · 0, 32 = 0, 25.

(a) De los cálculos anteriores, µ ≃ 0, 5, σ 2 ≃ 0, 25.


(b) De los cálculos anteriores y los resultados vistos en clases (y resumidos en el formulario),

σ2 0, 25 1
E(Y m.a.s. ) = µ ≃ 0, 5; Var(Y m.a.s. ) = ≃ = .
n 2500 10.000

Como es un estimador insesgado, el ECM será igual a la varianza, es decir, igual a


1/10.000.
(c) De manera análoga,

s s σ2 0, 16 1
E(Yprop ) = µ ≃ 0, 5; Var(Yprop )= ≃ = .
n 1600 10.000

Como es un estimador insesgado, el ECM será igual a la varianza, es decir a 1/10.000.


(d) De manera análoga,

s s σ2 0, 42 1
E(Yopt ) = µ ≃ 0, 5; Var(Yopt )= ≃ = .
n 1600 10.000

Como es un estimador insesgado, el ECM será igual a la varianza, es decir a 1/10.000.

14
(e) El ECM de las estrategias A y B es el mismo, pero B requiere de menos mesas: 1600 en
lugar de 2500, es decir, un 36% menos.
(f) Las estrategias B y C requieren el mismo número de mesas y llevan asociados el mismo
ECM, luego son iguales. Lo que sucede es que estamos en un caso muy particular en que,
a pesar de que las medias poblacionales de los estratos son muy distintas, la varianza
poblacional de los estratos son iguales. Por eso, los tamaños muestrales asociados a
muestras proporcionales y óptimas son los mismos.

Rúbrica:
Notas generales:

ˆ La parte (a) asigna 7 puntos, la (b) 4. Es muy improbable que alguien se vea perjudi-
cado comparado con si hubieran asignado 5 puntos cada una y será mucho más fácil la
corrección.
ˆ El total de puntos es 31 en lugar de 30. Eso no puede perjudicar a los alumnos y
simplifica la corrección.
ˆ Leer con cuidado, ya que la rúbrica es clara cuándo no importan errores de arrastre (se
indica que usa la expresión que obtuvo, lo cual significa que no importa si es la correcta)
vs. cuándo importa (se dice que obtiene el valor correcto)

(a) Las conductas son:


ˆ Usa la fórmula correcta para µ: 1 pto.
ˆ Usa los valores correctos de w1 y w2 al calcular µ y al calcular σ 2 : 1 pto.
ˆ Usa los valores correctos para aproximar µ1 y µ2 : 1 pto.
ˆ Obtiene el valor correcto que aproxima µ: 1 pto.
ˆ Usa la fórmula correcta para σ 2 : 1 pto.
ˆ Usa los valores correctos para aproximar σ12 y σ22 : 1 pto.
ˆ Obtiene el valor correcto que aproxima σ 2 : 1 pto.
(b) Las conductas son:
ˆ Nota que la esperanza es µ por las propiedades vistas en clases (no es necesario que
mencione que se vio en clases) y reemplaza por el valor aproximado de µ que obtuvo
en (a): 1 pto.
ˆ Plantea la fórmula correcta para la varianza del estimador: 1 pto.
ˆ Reemplaza por el valor de σ 2 que obtuvo en (a) e ingresa el valor correcto de n para
obtener la varianza: 1 pto.
ˆ Nota que, como el estimador es insesgado, su ECM es igual a su varianza: 1 pto.
(c) Las conductas son:

15
ˆ Nota que la esperanza es µ por las propiedades vistas en clases (no es necesario que
mencione que se vio en clases) y reemplaza por el valor aproximado de µ que obtuvo
en (a): 1 pto.
ˆ Plantea la fórmula correcta para la varianza del estimador: 1 pto.
ˆ Usa la expresión correcta para calcular σ 2 : 1 pto.
ˆ Reemplaza el valor que obtuvo de σ 2 . e ingresa el valor correcto de n para obtener
la varianza: 1 pto.
ˆ Nota que, como el estimador es insesgado, su ECM es igual a su varianza: 1 pto.
(d) Las conductas son:
ˆ Nota que la esperanza es µ por las propiedades vistas en clases (no es necesario que
mencione que se vio en clases) y reemplaza por el valor aproximado de µ que obtuvo
en (a): 1 pto.
ˆ Plantea la fórmula correcta para la varianza del estimador: 1 pto.
ˆ Usa la expresión correcta para calcular σ: 1 pto.
ˆ Reemplaza el valor que obtuvo de σ 2 . e ingresa el valor correcto de n para obtener
la varianza: 1 pto.
ˆ Nota que, como el estimador es insesgado, su ECM es igual a su varianza: 1 pto.
(e) Las conductas son:
ˆ Nota que los ECM de A y B son iguales (si no le dio igual, no puede hacer esta
parte): 2 ptos.
ˆ Nota que a igualdad de ECM, un menor n es mejor: 3 ptos.
(f) Las conductas son:
ˆ Nota que los ECM y los tamaños muestrales son iguales, luego las estrategias son
igual de eficientes: 2 ptos.
ˆ Nota que asignar tamaños muestrales óptimamente no reduce la varianza comparado
con asignación proporcional porque los varianzas (o desviaciones estándar) de los
estratos son iguales: 3 ptos.

6. Método de Momentos, Método Delta, Intervalo de confianza (20 puntos)

X1 , ..., Xn son variables aleatorias i.i.d. discretas, que pueden tomar solo dos valores, −1 y 1,
con función de probabilidad


 θ si x = 1,





f (x|θ) = 1 − θ si x = −1,






0 en otro caso.

16
Donde θ ∈ [0, 1] es el parámetro que se desea estimar. Se puede mostrar (no es necesario que
lo haga) que
E(Xi ) = 2θ − 1, Var(Xi ) = 4θ(1 − θ).

(a) Determine la esperanza y la varianza de la media muestral, X. ¿Cuál es la distribución


aproximada de X cuando n es grande?
(b) Use la expresión de E(Xi ) para construir un estimador MdM de θ que denotaremos por
θ.
b

(c) Use (a), (b) y el Método Delta para obtener buenas aproximaciones de la media y
varianza de θb cuando n es grande.
(d) Use (c) para construir un intervalo de confianza del 95% para θ.

Solución

(a) Tenemos:

E(X) = E(Xi ) = 2θ − 1,
Var(Xi ) 4θ(1 − θ)
Var(X) = = .
n n

Por el TCL, la distribución de X es aproximadamente normal con la media y varianza


anteriores.
(b) Tenemos:

E(Xi ) + 1 X +1
E(Xi ) = 2θ − 1 =⇒ E(Xi ) + 1 = 2θ =⇒ θ = =⇒ θbMdM = .
2 2

(c) El Método Delta (ver formulario) dice que

a a
α) ∼ N g(α), [g ′ (α)]2 · Var(b

b ∼ N (α, Var(b
α α)) =⇒ g(b α) .

En nuestro caso:

4θ(1 − θ)
α
b = X, Var(b
α) = Var(X) = .
n
También
x+1 1
g(x) = =⇒ g ′ (x) = .
2 2
Luego
2θ − 1 + 1
E(g(b
α)) = g(α) = g(E(X)) = =θ
2

1 4θ(1 − θ) θ(1 − θ)
α)) = Var(g(X)) ≃ [g ′ (X)]2 · Var(X) =
Var(g(b 2
· =
2 n n

17
Un valor aproximado para la esperanza se obtiene reemplazando θ por el valor estimado
θb = x+1 . Para la varianza hacemos lo mismo:
2
s
b − θ)
b ≃ θ(θ + 1) =⇒ D.S.( θ(1
bb b
Var(
d θ) d θ) b ≃ .
n n

Para la esperanza, podemos tomar θ̂.


(d) Usando (c), el intervalo de confianza será

[θb − 1, 96 · D.S.(
d θ); b θb + 1, 96 · D.S.(
d θ)].b

Rúbrica:

(a) 5 ptos. en total.


ˆ 1,5 puntos por la esperanza correcta.
ˆ 1,5 puntos por la varianza correcta.
ˆ 2 puntos por la distribución. Si dicen que es aproximadamente normal sin explicar
que es por el TCL poner los 2 puntos igual. Si no especifican que la esperanza y
varianza de la distribución normal son las que sacaron en la pregunta, poner los 2
puntos igual.
(b) 5 ptos. en total.
ˆ 3 puntos por despejar θ y dejarlo en función de la esperanza.
ˆ 2 puntos por reemplazar la esperanza por la media muestral para el estimador.
(c) 5 ptos. en total.
ˆ 2 puntos por llegar a la expresión correcta de la esperanza. Dar puntos intermedios
por el desarrollo si no llegan a expresiones correctas.
ˆ 2 puntos por llegar a la expresión correcta para la varianza. Dar puntos intermedios
por el desarrollo si no llegan a expresiones correctas.
ˆ 1 punto por reemplazar θ por θb para sus aproximaciones. Dar el punto por reem-
plazar θ por θb aunque no lleguen a las expresiones correctas para la esperanza y la
varianza.
(d) 5 puntos si está todo bien. También dar 5 puntos si en vez de 1.96 ponen 2. Descontar
1.5 puntos por errores en la expresión. Por ejemplo, descontar 1.5 puntos si ponen la
varianza en vez de la desviación estándar.

18

También podría gustarte