Pauta Examen P2022

Universidad de Chile — Facultad de Economı́a y Negocios
ENMES 255 — Estadı́stica II Todas las secciones

Semestre Primavera 2022 Sábado, 26 de noviembre, 2022
Pauta de Examen
Instrucciones
1. Tiene 10 minutos para leer el enunciado del examen antes de que se distribuyan los sets de
respuestas.
2. Este examen consta de 6 preguntas con un máximo de 135 puntos.
3. Salvo que se indique explı́citamente lo contrario, todas las partes de una pregunta dan el
mismo puntaje.
4. Tiene 2 horas y 45 minutos para responder el examen.
5. Asigne su tiempo de modo de dedicar suficiente tiempo a todas las preguntas. No dedique
demasiado tiempo a ninguna de ellas. Si asigna el mismo número de minutos que los puntos
que da cada pregunta, tendrá 30 minutos de libre disposición.
6. Sus respuestas deben contener todos los pasos intermedios para que el evaluador pueda estar
seguro de que llegó al resultado correcto sabiendo lo que hacı́a. Esto también le permitir’a al
evaluador darle puntaje parcial cuando no obtenga la respuesta correcta.
7. Responda cada pregunta en una hoja distinta e indique cuál pregunta está respondiendo.
8. Este es un examen a libro cerrado. No se permiten ayudas de ninguna especie, solo puede
usar el resumen oficial que se le entregó al comienzo.
1
1. Definiciones, independencia y covarianza (20 puntos)
X1 y X2 son variables aleatorias Bernoulli, con probabilidad de éxito 1/2, independientes.
(a) Determine la función de probabilidad conjunta de X1 y X2 .

(b) Defina Z = X1 + X2 y W = X1 − X2 . Encuentre la función de probabilidad de Z y la
función de probabilidad de W .
(c) Calcule Pr(Z = 1, W = 1). Use este resultado para mostrar que Z y W no son inde-
pendientes.
(d) Usando las propiedades de la covarianza, calcule Cov(Z, W ).
(e) ¿Existe una contradicción entre los resultados que obtuvo en (c) y (d)? Justifique su
respuesta.
Solución:
(a) Como X1 y X2 son independientes, se tiene que:
1 1 1
Pr(X1 = 0, X2 = 0) = Pr(X1 = 0) Pr(X2 = 0) = · =
2 2 4
1 1 1
Pr(X1 = 0, X2 = 1) = Pr(X1 = 0) Pr(X2 = 1) = · =
2 2 4
1 1 1
Pr(X1 = 1, X2 = 0) = Pr(X1 = 1) Pr(X2 = 0) = · =
2 2 4
1 1 1
Pr(X1 = 1, X2 = 1) = Pr(X1 = 1) Pr(X2 = 1) = · =
2 2 4
(b) Veamos primero la f.p. de Z: Z puede tomar los valores 0, 1 y 2. Luego,
1
Pr(Z = 0) = Pr(X1 = 0, X2 = 0) =
4
1
Pr(Z = 1) = Pr(X1 = 0, X2 = 1) + Pr(X1 = 1, X2 = 0) =
2
1
Pr(Z = 2) = Pr(X1 = 1, X2 = 1) =
4
Ahora la f.p de W : W puede tomar los valores -1, 0 y 1. Luego,
1
Pr(W = −1) = Pr(X1 = 0, X2 = 1) =
4
1
Pr(W = 0) = Pr(X1 = 0, X2 = 0) + Pr(X1 = 1, X2 = 1) =
2
1
Pr(W = 1) = Pr(X1 = 1, X2 = 0) =
4
(c) Tenemos que como el evento (Z = 1, W = 1) es igual al evento (X1 +X2 = 1, X1 −X2 = 1)
que a su vez equivale a (X1 = 1, X2 = 0),
2
1
Pr(Z = 1, W = 1) = Pr(X1 = 1, X2 = 0) =
4
Vemos que Pr(Z = 1, W = 1) ̸= Pr(Z = 1) Pr(W = 1), ya que la primera expresión
1 1
es igual a 4 mientras que la segunda expresión es igual a 8. Luego, Z y W no son
independientes.
(d) Usando las propiedades de la covarianza:
Cov(Z, W ) = Cov(X1 + X2 , X1 − X2 )
= Cov(X1 , X1 ) + Cov(X1 , −X2 ) + Cov(X2 , X1 ) + Cov(X2 , −X2 )
= Cov(X1 , X1 ) − Cov(X1 , X2 ) + Cov(X1 , X2 ) − Cov(X2 , X2 )
= Var(X1 ) − Var(X2 )
=0
ya que X1 y X2 son ambas Bernoulli con probabilidad de éxito 1/2, y por lo tanto tienen
la misma varianza (que es igual a 1/4).
(e) No hay contradicción. Como vimos en clases, dos variables aleatorias que no son inde-
pendientes pueden tener una covarianza igual a cero (por ejemplo, en el caso en que la
dependencia entre ellas sea no lineal) o distinta de cero. Lo que también vimos es que
si dos variables aleatorias son independientes, entonces su covarianza es igual a cero.
Rúbrica:
(a) 4 ptos. en total. 1 punto por cada una de las 4 probabilidades correctas, siempre y
cuando el estudiante demuestre que todas se calculan como el producto de las probabili-
dades marginales. Más de algún estudiante podrı́a optar por realizar una tabla de doble
entrada, con las probabilidades conjuntas en su interior. Esto está correcto en la medida
que el soporte y las probabiliades estén correctos y claramente identificados.
(b) 4 ptos. en total.
1 punto por identificar correctamente el soporte de Z.
0,25 punto por identificar correctamente la probabilidad de Z = 0.
0,5 punto por calcular correctamente la probabilidad de Z = 1.
0,25 punto por identificar correctamente la probabilidad de Z = 2.
1 punto por identificar correctamente el soporte de W .
0,25 punto por identificar correctamente la probabilidad de W = −1.
0,5 punto por calcular correctamente la probabilidad de W = 0.
0,25 punto por identificar correctamente la probabilidad de W = 1.
(c) 4 ptos. en total:
3
1 punto por notar la equivalencia de los eventos.
1 punto por notar que esta probabilidad vale 1/4.
1 punto por notar que la probabilidad conjunta no es igual al producto de las
marginales (debe notar que el producto de las marginales vale 1/8).
1 punto por concluir que no son independientes.
(d) 4 ptos. en total:
1 punto por ocupar correctamente la “distributividad” de la covarianza.
1 punto por sacar los -1 de la covarianza.
0,5 punto por ocupar correctamente la “conmutatividad” de la covarianza.
1 punto por ocupar correctamente que la covarianza de una v.a. consigo misma es
igual a su varianza.
0,5 punto por notar que las varianzas son iguales, y que por lo tanto la covarianza
pedida es igual a cero (solo si hizo correctamente todos los pasos anteriores). No es
necesario que noten que la varianza de ambas v.a. es igual a 1/4.
(e) 4 puntos por decir que no hay contradicción porque covarianza igual a cero no implica
necesariamente independencia. Es directo, por lo que no darı́a puntaje intermedio.
2. Los clientes de un banco (20 puntos)

Suponga que la cantidad de clientes que llegan a un banco durante un dı́a hábil se pueden
modelar con una distribución de Poisson de parámetro θ > 0 desconocido. Los analistas del
banco poseen una base de datos con los clientes que han llegado al banco durante los últimos
250 dı́as hábiles en que el banco ha atendido público, y desean estimar θ mediante métodos
bayesianos.
(a) Una primera analista, antes de mirar los datos, asegura que jamás han llegado menos de
50 clientes al dı́a, por lo que decide ocupar una previa que tiene densidad positiva solo
para θ > 50. ¿Puede la analista asegurar que su estimador bayesiano será consistente?
¿Por qué sı́ o por qué no?
P250
Suponga además que en la base de datos se observa que i=1 xi =50.000, donde xi corre-
sponde al número de clientes que se observa en el i-ésimo dı́a.
(b) Encuentre la función de verosimilitud para estos datos.

(c) Una segunda analista decide estimar θ utilizando una previa impropia dada por π(θ) = 1
para θ ∈ (0, ∞). Concluya que la posterior es un distribución Gamma. Identifique sus
parámetros y encuentre el estimador de Bayes para este caso.
4
(d) Una tercera analista decide estimar θ ocupando el modelo Poisson-Gamma con una
previa Gamma de parámetros α = 64 y β = 1/4. Encuentre el estimador de Bayes para
este caso.
Solución:
(a) Podemos notar que este analista no está cumpliendo con la Regla de Cromwell, por lo
que su estimador solo será consistente si el valor verdadero de θ es mayor que 50.
(b) Como vimos en clases, la función de verosimilitud en este caso será:
e−θ θx1 e−θ θx2 e−θ θxn P

L(θ; x) = f (x|θ) = · · ... · ∝ e−nθ θ xi = e−250θ θ5000
x1 ! x2 ! xn !
(c) En este caso tenemos que π(θ) = 1 para θ > 0. Luego,
P
π(θ|x) ∝ L(θ; x) · π(θ) ∝ e−nθ θ xi
Por inspección, podemos notar que la posterior corresponderá a la distribución Gamma

P
de parámetros α = xi + 1 y β = n. Luego, el estimador bayesiano será:
α 50001
θb = E(θ|x) = =
β 250
(d) Tenemos que en este caso la previa es Gamma(64,1/4), por lo que la posterior será
Gamma(64+50.000, 1/4+250). Luego, el estimador bayesiano será:
α 50064
θb = E(θ|x) = =
β 250, 25
Rúbrica:
(a) 5 ptos por dar el argumento completo: 2,5 ptos por mencionar que la previa no cumple
la Regla de Cromwell y 2,5 ptos por mencionar bajo qué condiciones el estimador será
consistente bajo esta previa. Dar puntaje parcial, 2,5 ptos, si menciona la regla de Regla
de Cromwell directamente o indirectamente (definiéndola con palabras), pero no entrega
una respuesta completa.
(b) 5 ptos por llegar a la expresión correcta. Notar que en la pauta hay tres expresiones
para la verosimilitud: una con igualdad y dos proporcionales. Si el estudiante llega a
cualquiera de la tres dar puntaje completo. Descontar 1 punto si llega a la verosimilitud
correcta y luego calcula el log de la verosimilitud (que no se pedı́a). Dar puntaje parcial,
2 ptos, por soluciones donde el estudiante parte de la idea correcta, pero se equivoca en
el álgebra.
(c) 5 ptos en total.
5
2 ptos por dar el argumento correcto que la posterior es una gamma.
1 pto por encontrar el primer parámetro de la posterior.
1 pto por encontrar el segundo parámetro de la posterior
1 pto por encontrar el estimador de Bayes.
(d) 5 ptos en total. Notar que como solo se pide el estimador de Bayes, el estudiante puede
poner directamente el estimador correcto saltándose los pasos intermedios. En este caso
dar 5 ptos. Si el estudiante concluye un estimador incorrecto sin poner pasos intermedios
dar 0 ptos. Para dar puntaje parcial:
2 ptos por dar el argumento correcto que la posterior es una gamma (decir según el
formulario está ok).
1 pto por encontrar el primer parámetro de la posterior.
1 pto por encontrar el segundo parámetro de la posterior
1 pto por encontrar el estimador de Bayes.
3. Los argumentos de Elon Musk para retractarse de comprar Twitter (15 puntos)
El 14 de abril de 2022, Elon Musk hizo una oferta no solicitada para adquirir Twitter en 44
mil millones de dólares. La oferta fue aceptada por la empresa el 25 de abril. Sin embargo,
en julio Musk recurrió a tribunales con la intención de retractarse del compromiso que habı́a
adquirido para comprar Twitter. Uno de los argumentos que dieron los abogados de Musk
fue el siguiente:
“En una reunión con ejecutivos de Twitter que se llevó a cabo el 6 de mayo, Musk
se enteró con asombro cuán pobre era el proceso con que Twitter determinaba el
número de cuentas falsas. Analistas [...] elegı́an una muestra aleatoria diaria de
100 cuentas (menos del 0,00005% de los usuarios diarios) [...] para concluir que en
cada trimestre menos del 5% de los usuarios [...] eran falsos”.
A continuación puede suponer que es cierto que de más de 200 millones de usuarios diarios,
Twitter solo determinaba el número de cuentas falsas en una muestra aleatoria (con reem-
plazo, para simplificar su análisis) de 100 usuarios, es decir, una muestra de 100·90=9000
usuarios trimestrales.
(a) ¿Cuál es el error conceptual en el argumento de Musk?

(b) Obtenga una cota superior para el margen de error de la estimación de la fracción
de cuentas falsas trimestrales, es decir, para e en el intervalo de confianza del 95%
[x − e, x + e], donde x es la fracción de cuentas falsas detectadas durante el trimestre.
(c) Suponga que la fracción de cuentas falsas estimada por Twitter en un trimestre deter-
minado fue 4%. La cota obtenida en (b), ¿es una buena aproximación de la precisión de
6
la estimación? Si es ası́, explique por qué; en caso contrario obtenga una expresión más
precisa para e. No es necesario que calcule la expresión, basta con que se pueda calcular
fácilmente usando Excel o Python.
Solución
(a) La precisión de la estimación de la media poblacional depende del tamaño de la muestra,

no de qué porcentaje de la población objetivo incluye la muestra.
(b) Por lo visto en clases (e incluido en el formulario),
1 1 1
e≃ √ = √ = ≃ 0, 01.
n 9000 95
√
(c) Tenemos σ
b= 0, 04 · 0, 96 ≃ 0, 2, de modo que
2b
σ 0, 4
e≃ √ = √ =≃ 0, 004.
n 9000
La reducción del largo del intervalo (y la mejora de la precisión) es de un 60%.
Rúbrica:
(a) 5 puntos por mencionar que lo relevante en este caso (muestra aleatoria con reemplazo)
es el tamaño de la muestra, no a que porcentaje corresponde de la población total.
No hay puntaje parcial en este caso. Si las estudiantes mencionan que el porcentaje
entrevistado es bajo, pero dan otro argumento para explicar el error de Musk, el puntaje
es 0.
(b) 5 puntos por usar correctamente la fórmula, indicando que esta fórmula es el caso más
conservador (asume valor cercano al 50% para la media muestral), restar 1 punto si no
menciona lo de 50%. Dar 5 puntos si usa la formula de la parte c) de forma correcta. Si
sólo escribe la fórmula, sin reemplazar n, dar 2 puntos.
(c) 5 ptos. en total:
2 puntos por mencionar que la información de cuentas falsas implica que no se debe
utilizar el supuesto más conservador o promedio muestral cercano al 50%.
2 puntos por usar fórmula correcta con desviación estandar corregida
1 puntos por mencionar la mejora en precisión.
4. Regresión de Poisson (30 puntos)
El modelo de regresión lineal simple que vimos en el curso, donde Yi condicional en Xi = xi es

normal con esperanza lineal en xi , es uno de los modelos más importantes en estadı́stica. Sin
embargo, suponer que los Yi siguen una distribución normal no es un buen supuesto cuando
7
los Yi toman valores enteros positivos. En ese caso parece más razonable suponer que los
Yi siguen una distribución de Poisson. El modelo que resulta introduciendo este cambio se
conoce como regresión de Poisson. Eso sı́, las habilidades que se evalúan a continuación
son similares a las desarrolladas cuando cubrimos la regresión lineal simple.
Al igual que en el modelo de regresión simple, los datos son (x1 , y1 ), (x2 , y2 ), ..., (xn , yn )
y el análisis asume que los yi son realizaciones de variables aleatorias Yi cuya distribución
depende de los xi observados. Cuando vimos el caso particular de regresión lineal en que la
recta pasa por el origen, supusimos que los Yi eran normales independientes con esperanza
θxi y varianza σ 2 . A continuación también suponemos que son independientes pero ahora la
distribución de los Yi es Poisson con parámetro θxi . Además suponemos que todos los xi son
estrictamente positivos. El parámetro que se desea estimar es la pendiente de la recta, θ.
(a) Exprese E(Yi |Xi = xi ) y Var(Yi ]Xi = xi ) en función de θ y xi .

(b) ¿En cuál de los casos siguientes es más pertinente el modelo de regresión de Poisson que
la regresión lineal simple que vimos en clases? Justifique.
i. yi es la altura de la hija; xi la altura de la madre.
ii. yi es el número de nuevas empresas creadas en Chile en un año; xi el precio del
cobre ese año.
iii. yi es la variación porcentual del precio de una acción determinada; xi la variación
del ı́ndice accionario correspondiente.
Se puede mostrar (no es necesario que lo haga) que el estimador de máxima-verosimilitud de

θ es !−1
n
X n
X
θbEMV = xi · Yi .
i=1 i=1
Indicación: En lo que sigue, las esperanzas y varianzas que se solicitan son condicionales
en los valores (x1 , x2 , ..., xn ). Por simplicidad, puede omitir el argumento condicional en la
notación de su respuesta.
(c) Muestre que θbEMV es un estimador insesgado de θ. En su derivación debe indicar cada
vez que usa una propiedad de la esperanza y cuál es la propiedad que utilizó.
(d) Exprese la varianza y error cuadrático medio de θbEMV en función de los xi y θ. En
su derivación debe indicar cada vez que usa una propiedad de la varianza y cuál es la
propiedad que utilizó.
Un estimador alternativo de θ es el que derivamos cuando vimos regresión simple:
n
!−1 n
X X
θbRS = x2i · xi Yi .
i=1 i=1
8
(e) Repita las partes (c) y (d) con θbRS en lugar de θbEMV .
(f) Determine la condición que deben cumplir los xi para que el ECM de θbEMV sea menor
que el ECM de θbRS . No es necesario que haga la demostración, pero le contamos que
esta condición se cumple siempre (a menos que todos los xi sean iguales en cuyo caso
los dos ECM son iguales).
Solución
(a) Tenemos
E(Yi ) = Var(Yi ) = θxi .
(b) La aplicación con el número de nuevas empresas, ya que solo en esa aplicación los yi
toman valores enteros positivos.
(c) Tenemos:
 !−1 
n
X n
X
E(θbEMV ) = E  xi · Yi  Definición de θbEMV .
i=1 i=1
n
!−1 " n
#
X X
= xi E Yi E[aX] = aE[X].
i=1 i=1
n
!−1 n
X X
= xi · E [Yi ] E[X + Y ] = E[X] + E[Y ].
i=1 i=1
n
!−1 n
X X
= xi · θxi E[Yi ] = θxi
i=1 i=1
n
!−1 n
!
X X
= xi ·θ· xi
i=1 i=1
= θ.
Como E(θbEMV ) = θ, concluimos que E(θbEMV ) es insesgado.

(d) Tenemos:
9
 !−1 
n
X n
X
Var(θbEMV ) = Var  xi · Yi  Definición de θbEMV .
i=1 i=1
n
!−2 " n
#
X X
= xi Var Yi Var[aX] = a2 Var[X].
i=1 i=1
n
!−2 n
X X
= xi · Var [Yi ] X,Y indep. ⇒ Var[X + Y ] = Var[X] + Var[Y ].
i=1 i=1
n
!−2 n
X X
= xi · θxi Var[Yi ] = θxi
i=1 i=1
n
!−2 n
!
X X
= xi ·θ· xi
i=1 i=1
n
!−1
X
= xi θ.
i=1
Como el estimador es insesgado, el ECM será igual a la varianza.

(e) Tenemos:
 !−1 
n
X n
X
E(θbRS ) = E  x2i · xi Yi  Definición de θbRS .
i=1 i=1
n
!−1 " n #
X X
= x2i E x i Yi E[aX] = aE[X].
i=1 i=1
n
!−1 n
X X
= x2i · E [xi Yi ] E[X + Y ] = E[X] + E[Y ].
i=1 i=1
n
!−1 n
X X
= x2i · xi E [Yi ] E[aX] = aE[X].
i=1 i=1
n
!−1 n
X X
= x2i · xi (θxi ) E[Yi ] = θxi
i=1 i=1
n
!−1 n
!
X X
= x2i ·θ· x2i
i=1 i=1
= θ.
Como E(θbRS ) = θ, concluimos que E(θbRS ) es insesgado.
10
Tenemos:
 !−1 
n
X n
X
Var(θbRS ) = Var  x2i · xi Yi  Definición de θbRS .
i=1 i=1
n
!−2 " n
#
X X
= x2i Var xi Yi Var[aX] = a2 Var[X].
i=1 i=1
n
!−2 n
X X
= x2i · Var [xi Yi ] X,Y indep. ⇒ Var[X + Y ] = Var[X] + Var[Y ].
i=1 i=1
n
!−2 n
X X
= x2i · x2i Var [Yi ] Var[aX] = a2 Var[X].
i=1 i=1
n
!−2 n
X X
= x2i · θx3i Var[Yi ] = θxi
i=1 i=1
n
!−2 n
!
X X
= x2i ·θ· x3i
i=1 i=1
Pn 3
i=1 xi
= θ.
2 2
Pn
i=1 xi
Como el estimador es insesgado, su ECM será igual a la varianza.

(f) Se debe cumplir
ECM(θ; θbEMV ) < Var(θ; θbRS ) ⇐⇒ Var(θbEMV ) < Var(θbRS ) ⇐⇒
n
!−1 Pn n
!2 n
! n
!
X x3 X X X
⇐⇒ xi θ. < Pni=1 i2 θ ⇐⇒ x2i < x3i · xi .
2
i=1 i=1 xi i=1 i=1 i=1
Para su educación, que la desigualdad anterior se cumple es consecuencia de la Desigual-

dad de Cauchy-Schwarz, según la cual
X X X
( ui vi )2 ≤ ( u2i )( vi2 )
3/2
con desigualdad estricta si los ui no son un múltiplo de los vi . Se aplica con ui = xi ,
1/2
vi = xi .
Rúbrica:
(a) 5 ptos en total.

2,5 ptos por la esperanza.
2,5 ptos por la varianza.
(b) 5 ptos en total.
11
1,5 ptos por justificar que el caso i. no es pertinente.
2 ptos por justificar que el caso ii. es pertinente.
1,5 ptos por justificar que el caso iii. no es pertinente.
(c) 5 ptos en total.
1 pto. si el estudiante dice (o escribe la condición) que un estimador de θ es insesgado
si su esparanza es igual a θ.
1 pto. por tomar esperanza a la expresión (estimador) correcta.
1 pto. por uso correcto de propiedad E(aX) = aE(X).
1 pto. por uso correcto de propiedad E(X + Y ) = E(X) + E(Y ).
0,5 pto por el uso de la esperanza de la Possion: E(Yi ) = θxi .
0,5 ptos por concluir que es insesgado.
(d) 5 ptos en total.
1 pto por indicar que como es insesgado, la varianza y ECM coinciden.
1 pto. por tomar varianza a la expresión (estimador) correcta.
1 pto. por uso correcto de propiedad Var(aX) = a2 Var(X).
1 pto. por uso correcto de propiedad: X e Y independintes, entonces Var(X + Y ) =
Var(X) + Var(Y ).
0,5 pto por el uso de la varianza de la Possion: Var(Yi ) = θxi .
0,5 ptos por concluir con la expresión de la varianza. Si no simplifica, pero llega a
lo correcto, dar el puntaje.
(e) 5 ptos. en total. 2,5 ptos para la esperanza
0,5 pto. por tomar esperanza a la expresión (estimador) correcta.
0,5 pto. por uso correcto de propiedad E(aX) = aE(X).
0,5 pto. por uso correcto de propiedad E(X + Y ) = E(X) + E(Y ).
0,5 pto. por nuevamente uso correcto de propiedad E(aX) = aE(X).
0,25 pto por el uso de la esperanza de la Possion: E(Yi ) = θxi .
0,25 ptos por concluir que es insesgado.
Y 2,5 ptos para la varianza (ECM).
0,5 pto por indicar que como es insesgado, la varianza y ECM coinciden.
0,25 pto. por tomar varianza a la expresión (estimador) correcta.
0,25 pto. por uso correcto de propiedad Var(aX) = a2 Var(X).
0,5 pto. por uso correcto de propiedad: X e Y independintes, entonces Var(X +Y ) =
Var(X) + Var(Y ).
0,25 pto. por nuevamente uso correcto de propiedad Var(aX) = a2 Var(X).
0,25 pto por el uso de la varianza de la Possion: Var(Yi ) = θxi .
12
0,25 ptos por concluir con la expresión de la varianza. Si no simplifica, pero llega a
lo correcto, dar el puntaje.
(f) 5 ptos. por llegar a la condición solicitada. Dar puntaje parcial por partir de la idea
correcta, pero no llegar a lo socilicitado: dar 1,5 ptos. si parten reemplazando los ECM
que encontraron en las partes previas (independinte de si son correctos o no) en la
condición (desigualdad) solicitada en el enunaciado.
5. Determinando el tamaño de la muestra estratificada (30 puntos)
Un canal deportivo realiza una encuesta para estimar la fracción de sus clientes que están
dispuestos a pagar el doble por un servicio premium que está considerando ofrecer.
El canal divide a sus 800 mil clientes en dos grupos. El primer grupo, de 400 mil clientes, se
conecta durante muchas horas cada semana. El segundo grupo, también de 400 mil clientes,
se conecta mucho menos.
Estimaciones preliminares, basadas en una encuesta piloto, indican que aproximadamente el
80% de los clientes del primer grupo y solo alrededor del 20% del segundo grupo estarı́an
interesados en pagar el doble por un servicio premium.
Tres analistas contratadas por el canal proponen estrategias distintas para construir la mues-
tra definitiva. La analista A propone obtener una muestra aleatoria simple, de tamaño
2500. La analista B propone obtener una muestra aleatoria estratificada de tamaño 1600, con
tamaños muestrales proporcionales al tamaño de los estratos. La analista C propone obtener
una muestra aleatoria estratificada de tamaño 1600, con tamaños muestrales óptimos. Las
tres estrategias consideran muestras con reemplazo.
(a) Use la información disponible de la encuesta piloto para obtener estimadores razonables
para la media y varianza de la población objetivo, µ y σ 2 .
(b) Use la información disponible para aproximar la esperanza y varianza del estimador de
la media poblacional asociado a la estrategia de A. Obtenga un valor aproximado para
el ECM asociado a esta estrategia.
(c) Análogo a (a) pero para la analista B.
(d) Análogo a (a) pero para la analista C.
(e) Use (a) y (b) para explicar por qué la estrategia de la analista B es mejor que la estrategia
de la analista A.
(f) Use (b) y (c) para concluir que las estrategias de las analistas B y C son igual de
buenas. ¿Por qué la estrategia que asigna los tamaños de las muestras de cada estrato
óptimamente no reduce el ECM comparado con la estrategia que los asigna de manera
proporcional?
13
Indicación: Usando el subı́ndice 1 para el estrato de alta demanda y el 2 para el de baja
demanda, obtenga buenas aproximaciones para las medias y varianzas poblacionales de cada
estrato, es decir, para µ1 , µ2 , σ12 y σ22 . Luego use la información disponible para obtener
buenas aproximaciones para la fracción de clientes interesados en un servicio premium, µ y la
varianza poblacional de esta fracción, σ 2 . Finalmente, aproxime σ 2 y σ 2 . Toda la información
anterior será necesaria para responder las preguntas.
Solución
Tenemos:
w1 = w2 = 0, 5.
µ1 ≃ 0, 8; w2 ≃ 0, 2.
σ12 ≃ 0, 8 · (1 − 0, 8) = 0, 16; σ22 ≃ 0, 2 · (1 − 0, 2) = 0, 16.
√ √
σ1 ≃ 0, 16 = 0, 4; σ2 ≃ 0, 16 = 0, 4.
Luego:
µ = w1 µ1 + w2 µ2 ≃ 0, 5 · 0, 8 + 0, 5 · 0, 2 = 0, 5.
σ 2 = w1 σ12 + w2 σ22 ≃ 0, 5 · 0, 16 + 0, 5 · 0, 16 = 0, 16.
σ = w1 σ1 + w2 σ2 ≃ 0, 5 · 0, 4 + 0, 5 · 0, 4 = 0, 4.
σ 2 = σ 2 + w1 (µ1 − µ)2 + w2 (µ2 − µ)2 ≃ 0, 16 + 0, 5 · 0, 32 + 0, 5 · 0, 32 = 0, 25.
(a) De los cálculos anteriores, µ ≃ 0, 5, σ 2 ≃ 0, 25.

(b) De los cálculos anteriores y los resultados vistos en clases (y resumidos en el formulario),
σ2 0, 25 1
E(Y m.a.s. ) = µ ≃ 0, 5; Var(Y m.a.s. ) = ≃ = .
n 2500 10.000
Como es un estimador insesgado, el ECM será igual a la varianza, es decir, igual a

1/10.000.
(c) De manera análoga,
s s σ2 0, 16 1
E(Yprop ) = µ ≃ 0, 5; Var(Yprop )= ≃ = .
n 1600 10.000
Como es un estimador insesgado, el ECM será igual a la varianza, es decir a 1/10.000.

(d) De manera análoga,
s s σ2 0, 42 1
E(Yopt ) = µ ≃ 0, 5; Var(Yopt )= ≃ = .
n 1600 10.000
Como es un estimador insesgado, el ECM será igual a la varianza, es decir a 1/10.000.
14
(e) El ECM de las estrategias A y B es el mismo, pero B requiere de menos mesas: 1600 en
lugar de 2500, es decir, un 36% menos.
(f) Las estrategias B y C requieren el mismo número de mesas y llevan asociados el mismo
ECM, luego son iguales. Lo que sucede es que estamos en un caso muy particular en que,
a pesar de que las medias poblacionales de los estratos son muy distintas, la varianza
poblacional de los estratos son iguales. Por eso, los tamaños muestrales asociados a
muestras proporcionales y óptimas son los mismos.
Rúbrica:
Notas generales:
La parte (a) asigna 7 puntos, la (b) 4. Es muy improbable que alguien se vea perjudi-
cado comparado con si hubieran asignado 5 puntos cada una y será mucho más fácil la
corrección.
El total de puntos es 31 en lugar de 30. Eso no puede perjudicar a los alumnos y
simplifica la corrección.
Leer con cuidado, ya que la rúbrica es clara cuándo no importan errores de arrastre (se
indica que usa la expresión que obtuvo, lo cual significa que no importa si es la correcta)
vs. cuándo importa (se dice que obtiene el valor correcto)
(a) Las conductas son:

Usa la fórmula correcta para µ: 1 pto.
Usa los valores correctos de w1 y w2 al calcular µ y al calcular σ 2 : 1 pto.
Usa los valores correctos para aproximar µ1 y µ2 : 1 pto.
Obtiene el valor correcto que aproxima µ: 1 pto.
Usa la fórmula correcta para σ 2 : 1 pto.
Usa los valores correctos para aproximar σ12 y σ22 : 1 pto.
Obtiene el valor correcto que aproxima σ 2 : 1 pto.
(b) Las conductas son:
Nota que la esperanza es µ por las propiedades vistas en clases (no es necesario que
mencione que se vio en clases) y reemplaza por el valor aproximado de µ que obtuvo
en (a): 1 pto.
Plantea la fórmula correcta para la varianza del estimador: 1 pto.
Reemplaza por el valor de σ 2 que obtuvo en (a) e ingresa el valor correcto de n para
obtener la varianza: 1 pto.
Nota que, como el estimador es insesgado, su ECM es igual a su varianza: 1 pto.
(c) Las conductas son:
15
en (a): 1 pto.
Usa la expresión correcta para calcular σ 2 : 1 pto.
Reemplaza el valor que obtuvo de σ 2 . e ingresa el valor correcto de n para obtener
la varianza: 1 pto.
(d) Las conductas son:
en (a): 1 pto.
Usa la expresión correcta para calcular σ: 1 pto.
Reemplaza el valor que obtuvo de σ 2 . e ingresa el valor correcto de n para obtener
la varianza: 1 pto.
(e) Las conductas son:
Nota que los ECM de A y B son iguales (si no le dio igual, no puede hacer esta
parte): 2 ptos.
Nota que a igualdad de ECM, un menor n es mejor: 3 ptos.
(f) Las conductas son:
Nota que los ECM y los tamaños muestrales son iguales, luego las estrategias son
igual de eficientes: 2 ptos.
Nota que asignar tamaños muestrales óptimamente no reduce la varianza comparado
con asignación proporcional porque los varianzas (o desviaciones estándar) de los
estratos son iguales: 3 ptos.
6. Método de Momentos, Método Delta, Intervalo de confianza (20 puntos)
X1 , ..., Xn son variables aleatorias i.i.d. discretas, que pueden tomar solo dos valores, −1 y 1,
con función de probabilidad


 θ si x = 1,





f (x|θ) = 1 − θ si x = −1,






0 en otro caso.

16
Donde θ ∈ [0, 1] es el parámetro que se desea estimar. Se puede mostrar (no es necesario que
lo haga) que
E(Xi ) = 2θ − 1, Var(Xi ) = 4θ(1 − θ).
(a) Determine la esperanza y la varianza de la media muestral, X. ¿Cuál es la distribución

aproximada de X cuando n es grande?
(b) Use la expresión de E(Xi ) para construir un estimador MdM de θ que denotaremos por
θ.
b
(c) Use (a), (b) y el Método Delta para obtener buenas aproximaciones de la media y
varianza de θb cuando n es grande.
(d) Use (c) para construir un intervalo de confianza del 95% para θ.
Solución
(a) Tenemos:
E(X) = E(Xi ) = 2θ − 1,
Var(Xi ) 4θ(1 − θ)
Var(X) = = .
n n
Por el TCL, la distribución de X es aproximadamente normal con la media y varianza

anteriores.
(b) Tenemos:
E(Xi ) + 1 X +1
E(Xi ) = 2θ − 1 =⇒ E(Xi ) + 1 = 2θ =⇒ θ = =⇒ θbMdM = .
2 2
(c) El Método Delta (ver formulario) dice que
a a
α) ∼ N g(α), [g ′ (α)]2 · Var(b

b ∼ N (α, Var(b
α α)) =⇒ g(b α) .
En nuestro caso:
4θ(1 − θ)
α
b = X, Var(b
α) = Var(X) = .
n
También
x+1 1
g(x) = =⇒ g ′ (x) = .
2 2
Luego
2θ − 1 + 1
E(g(b
α)) = g(α) = g(E(X)) = =θ
2
1 4θ(1 − θ) θ(1 − θ)
α)) = Var(g(X)) ≃ [g ′ (X)]2 · Var(X) =
Var(g(b 2
· =
2 n n
17
Un valor aproximado para la esperanza se obtiene reemplazando θ por el valor estimado
θb = x+1 . Para la varianza hacemos lo mismo:
2
s
b − θ)
b ≃ θ(θ + 1) =⇒ D.S.( θ(1
bb b
Var(
d θ) d θ) b ≃ .
n n
Para la esperanza, podemos tomar θ̂.

(d) Usando (c), el intervalo de confianza será
[θb − 1, 96 · D.S.(
d θ); b θb + 1, 96 · D.S.(
d θ)].b
Rúbrica:
(a) 5 ptos. en total.

1,5 puntos por la esperanza correcta.
1,5 puntos por la varianza correcta.
2 puntos por la distribución. Si dicen que es aproximadamente normal sin explicar
que es por el TCL poner los 2 puntos igual. Si no especifican que la esperanza y
varianza de la distribución normal son las que sacaron en la pregunta, poner los 2
puntos igual.
(b) 5 ptos. en total.
3 puntos por despejar θ y dejarlo en función de la esperanza.
2 puntos por reemplazar la esperanza por la media muestral para el estimador.
(c) 5 ptos. en total.
2 puntos por llegar a la expresión correcta de la esperanza. Dar puntos intermedios
por el desarrollo si no llegan a expresiones correctas.
2 puntos por llegar a la expresión correcta para la varianza. Dar puntos intermedios
por el desarrollo si no llegan a expresiones correctas.
1 punto por reemplazar θ por θb para sus aproximaciones. Dar el punto por reem-
plazar θ por θb aunque no lleguen a las expresiones correctas para la esperanza y la
varianza.
(d) 5 puntos si está todo bien. También dar 5 puntos si en vez de 1.96 ponen 2. Descontar
1.5 puntos por errores en la expresión. Por ejemplo, descontar 1.5 puntos si ponen la
varianza en vez de la desviación estándar.
18

Pauta Examen P2022

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Pauta Examen P2022

Cargado por

Copyright:

Formatos disponibles

Universidad de Chile — Facultad de Economı́a y Negocios

ENMES 255 — Estadı́stica II Todas las secciones

2. Este examen consta de 6 preguntas con un máximo de 135 puntos.

4. Tiene 2 horas y 45 minutos para responder el examen.

(a) Determine la función de probabilidad conjunta de X1 y X2 .

(a) Como X1 y X2 son independientes, se tiene que:

Ahora la f.p de W : W puede tomar los valores -1, 0 y 1. Luego,

2. Los clientes de un banco (20 puntos)

(b) Encuentre la función de verosimilitud para estos datos.

e−θ θx1 e−θ θx2 e−θ θxn P

Por inspección, podemos notar que la posterior corresponderá a la distribución Gamma

(a) ¿Cuál es el error conceptual en el argumento de Musk?

(a) La precisión de la estimación de la media poblacional depende del tamaño de la muestra,

La reducción del largo del intervalo (y la mejora de la precisión) es de un 60%.

4. Regresión de Poisson (30 puntos)

El modelo de regresión lineal simple que vimos en el curso, donde Yi condicional en Xi = xi es

(a) Exprese E(Yi |Xi = xi ) y Var(Yi ]Xi = xi ) en función de θ y xi .

Se puede mostrar (no es necesario que lo haga) que el estimador de máxima-verosimilitud de

Un estimador alternativo de θ es el que derivamos cuando vimos regresión simple:

Como E(θbEMV ) = θ, concluimos que E(θbEMV ) es insesgado.

Como el estimador es insesgado, el ECM será igual a la varianza.

Como E(θbRS ) = θ, concluimos que E(θbRS ) es insesgado.

Como el estimador es insesgado, su ECM será igual a la varianza.

ECM(θ; θbEMV ) < Var(θ; θbRS ) ⇐⇒ Var(θbEMV ) < Var(θbRS ) ⇐⇒

Para su educación, que la desigualdad anterior se cumple es consecuencia de la Desigual-

(a) 5 ptos en total.

5. Determinando el tamaño de la muestra estratificada (30 puntos)

(a) De los cálculos anteriores, µ ≃ 0, 5, σ 2 ≃ 0, 25.

Como es un estimador insesgado, el ECM será igual a la varianza, es decir, igual a

Como es un estimador insesgado, el ECM será igual a la varianza, es decir a 1/10.000.

Como es un estimador insesgado, el ECM será igual a la varianza, es decir a 1/10.000.

(a) Las conductas son:

6. Método de Momentos, Método Delta, Intervalo de confianza (20 puntos)

(a) Determine la esperanza y la varianza de la media muestral, X. ¿Cuál es la distribución

Por el TCL, la distribución de X es aproximadamente normal con la media y varianza

(c) El Método Delta (ver formulario) dice que

Para la esperanza, podemos tomar θ̂.

(a) 5 ptos. en total.

También podría gustarte