Examen Primavera 2021 Solución

Universidad de Chile — Facultad de Economı́a y Negocios
ENMES 250 — Estadı́stica II Todas las secciones

Semestre Primavera 2021 Sábado, 20 de noviembre, 2021
Examen
Instrucciones
1. Esta parte consta de 6 preguntas con un máximo de 120 puntos.
2. Salvo que se indique explı́citamente lo contrario, todas las partes de una pregunta dan el
mismo puntaje.
3. Tiene 2 horas y 30 minutos para responder el control.
4. Asigne su tiempo de modo de dedicar suficiente tiempo a todas las preguntas. No dedique
demasiado tiempo a ninguna de ellas. Si asigna el mismo número de minutos que los puntos
que da cada pregunta, tendrá 30 minutos de libre disposición.
5. Sus respuestas deben contener todos los pasos intermedios para que el evaluador pueda estar
seguro de que llegó al resultado correcto sabiendo lo que hacı́a. Esto también le permitirá al
evaluador darle puntaje parcial cuando no obtenga la respuesta correcta.
6. Responda cada pregunta en una hoja distinta e indique cuál pregunta está respondiendo.
7. Este es un control a libro cerrado. No se permiten ayudas de ninguna especie, solo puede
usar el resumen oficial.
1
1. Probabilidades en un experimento aleatorizado emparejado (15 puntos)
Un experimento aleatorizado emparejado es un tipo de experimento aleatorizado donde las
unidades que participan en el estudio vienen en pares que comparten una caracterı́stica rele-
vante. Por ejemplo, cada par tiene el mismo sexo o la misma región de residencia o el mismo
nivel de ingreso. Lo clave de estos experimentos es que dentro de cada pareja se asigna una
unidad al grupo de tratamiento y la otra al grupo de control. Especı́ficamente, dentro de cada
par de unidades, se lanza una moneda justa para decidir qué miembro de la pareja es tratado
y cuál es el control.
Considere 15 pares de unidades que participan en un experimento aleatorizado emparejado.
Para cada unidad i en el par j en el estudio (con i = 1, 2 y j = 1, 2, ..., 15), definamos la
variable aleatoria Wi, j que toma el valor 1 si la unidad i en el par j es tratada y toma el valor
0 si la unidad i en el par j es control. Ası́, por ejemplo, W2,1 = 1 si la segunda unidad del
primer par es tratada y W2,1 = 0 si esta unidad es control.
A continuación consideramos el par 1 de modo que las variables aleatorias relevantes serán
W1,1 y W2,1 . Obviamente lo que sigue vale para los restantes pares también.
a) Determine la función de probabilidad de W1,1 . Calcule su esperanza y su varianza.

Ayuda: Comience por determinar qué valores pueden tomar estas variables aleatorias.
b) Calcule la función de probabilidad conjunta de W1,1 y W2,1 .
c) Definamos Nt como el número de tratados en este experimento. Calcule la función de
probabilidad de Nt .
Solución:
a) W1,1 puede tomar los valores 1 con probabilidad 1/2 y 0 con una probabilidad 1/2. Es
decir, W1,1 ∼ Ber( 12 ). Dado lo anterior: E(W1,1 ) = 12 y Var(W1,1 ) = 14 . Aunque no se
pide, lo mismo vale para todos los Wi, j .
b) Dentro del par 1, una unidad es tratada y la otra es control. Luego las variables aleato-
rias W1,1 y W2,1 no son independientes pues siempre una es cero y la otra es uno y solo
(W1,1 = 1,W2,1 = 0) y (W1,1 = 0,W2,1 = 1) tienen probabilidad estrictamente positiva.
Existen varias formas de calcular las probabilidades de los eventos anteriores. Una
nota que el evento (W1,1 = 1,W2,1 = 0) es igual al evento (W1,1 = 1), de modo que
Pr(W1,1 = 1,W2,1 = 0) = 21 . Otra es notar que
Pr(W2,1 = 0 | W1,1 = 1) = 1, Pr(W2,1 = 1 | W1,1 = 0) = 1.
De modo que
1 1
Pr(W1,1 = 1,W2,1 = 0) = Pr(W2,1 = 0 | W1,1 = 1) · Pr(W1,1 = 1) = 1 · = ,
2 2
1 1
Pr(W1,1 = 0,W2,1 = 1) = Pr(W2,1 = 1 | W1,1 = 0) · Pr(W1,1 = 0) = 1 · = .
2 2
2
c) Nt = 15 con probabilidad igual a 1 y Nt toma un valor distinto a 15 con probabilidad
igual a 0.
2. Encuestas para la segunda vuelta (15 puntos)

Pocos dı́as antes de las segunda vuelta presidencial, un candidato cuenta con dos encuestas
que cumplen con las condiciones ideales de una encuesta probabilı́stica. En la primera en-
cuesta la muestra aleatoria es de 3600 personas y lo prefieren 1872, es decir, un 52 %. En la
segunda la muestra es de 900 personas y lo prefieren 477, es decir, un 53 %.
a) Obtenga un intervalo de confianza (aproximado) del 95 % para la fracción de la pobla-

ción que apoya al candidato basado en la primera encuesta.
b) Obtenga un intervalo de confianza (aproximado) del 95 % para la fracción de la pobla-
ción que apoya al candidato basado en la segunda encuesta.
c) El candidato debe elegir una de las encuestas para hacerla pública. Sus asesores sugie-
ren que sea la segunda porque el porcentaje que lo apoya es mayor en esta encuesta. En
base a sus respuestas en las partes anteriores determine, basado en un análisis estadı́sti-
co serio, cuál encuesta es más favorable al candidato. Justifique.
Solución:
a) El intervalo aproximado de confianza es

1 1 1 1
[x − √ , x + √ ] = [0, 52 − , 0, 52 + ] = [0, 5033 , 0, 5367].
n n 60 60
b) El intervalo aproximado de confianza es

1 1 1 1
[x − √ , x + √ ] = [0, 53 − , 0, 53 + ] = [0, 4967 , 0, 5633].
n n 30 30
c) La primera encuesta es más favorable al candidato, pues el intervalo de confianza in-

cluye solo valores mayores que 0,5. Esto, a pesar de que el centro del intervalo (y el
e.m.v. de la fracción de la población que prefiere al candidato) es mayor para la segunda
encuesta.
3. Una buena noticia (15 puntos)1

Hace pocos dı́as (Financial Times, 5 de noviembre, 2021) Pfizer informó los resultados del
ensayo clı́nico de un nuevo fármaco para tratar el Covid-19, Paxlovid.
1 Las cifras que siguen difieren levemente de las verdaderas para facilitar sus cálculos.
3
En un experimento completamente aleatorizado con personas a las cuales se les acababa de
diagnosticar Covid-19, se administró la droga a 610 personas y el placebo a 610 personas.
Tres dı́as después hubo 5 hospitalizaciones entre los tratados y 43 entre los controles.
Los resultados para los tratados (1 si es hospitalizado, 0 si no) se modelan como variables
i.i.d. Bernoulli con parámetro pt . Los resultados para los controles (1 si es hospitalizado, 0
si no) se modelan como variables i.i.d. Bernoulli con parámetro pc . La eficacia del fármaco
se define como e = (pc − pt )/pc .
Ayuda: Si en una o más de las siguientes preguntas, una vez planteado el modelo estadı́stico,
sabe cuál es el e.m.v., no es necesario que lo derive.
a) Obtenga el valor que toma el e.m.v. de pt .

b) Obtenga el valor que toma el e.m.v. de pc .
c) Obtenga el valor que toma el e.m.v. de e.
Solución:
a) El e.m.v. en el modelo Bernoulli es la media muestral (no es necesario demostarlo).

Luego pbt = 5/610.
b) De manera análoga: pbc = 43/610.
c) Como los e.m.v. son invariantes:
pbc − pbt 43 − 5
eb = = = 88, 4 %.
pbc 43
4. Tanques alemanes con una observación (25 puntos)

Nota: Se puede responder las partes c) en adelante aun si no respondió las partes a) y b).
Repaso sobre la uniforme discreta: Una variable aleatoria Y sigue una distribución unifor-
me discreta en {1, 2, ..., N} si f (k) = 1/N para k = 1, 2, ..., N. Entonces:
1 1 2
E(Y ) = (N + 1), Var(Y ) = (N − 1).
2 12
Se dispone de una observación, x, de una v.a. X que sigue una uniforme discreta en {1, 2, ..., θ}.
El parámetro de interés es el entero estrictamente positivo θ.
a) Determine la función de verosimilitud L(θ; x).

b) Determine el e.m.v. de θ.
θ = 2X − 1.
θ = 2X y e
A continuación consideramos dos posibles estimadores de θ: b
4
c) Determine el sesgo de b
θ y el ECM de b
θ.
d) Muestre que e
θ es un estimador insesgado de θ y calcule su ECM.
e) Compare los ECM que obtuvo para b
θye
θ. ¿Cuál estimador es mejor?
Sol.:
a) L(θ; x) = 1/θ para θ = x, x + 1, x + 2, ... y L(θ; x) = 0 para otros valores de x.

b) Como 1/θ es decreciente en θ el valor del e.m.v. será x y el e.m.v. será X.
θ) = E(2X) − θ = 2E(X) − θ = 2 (θ + 1) − θ = 1.
c) b(θ; b 2
4 2
ECM(θ; b θ) = [b(θ; b 2
θ)] + Var(X) = 1 + 12 (θ2 − 1) = 1 + 13 (θ2 − 1) = 23 + θ3 .
d) E(eθ) = E(2X − 1) = 2E(X) − 1 = 2 · 21 (θ + 1) − 1 = θ.
ECM(θ; e θ) = Var(2X − 1) = Var(2X) = 4Var(X) = 13 (θ2 − 1) = 13 θ2 − 13 .
1 2 1 1 2 2
e) 3 θ − 3 < 3 θ + 3 ⇐⇒ ECM(θ; θ) < ECM(θ; θ).
e b
Concluimos que ECM(θ; e
θ) será menor a ECM(θ; b
θ) para cualquier valor de θ.
5. Estimadores de Bayes y la baterı́a de los celulares (25 puntos)

Una empresa que produce celulares asegura que la baterı́a de su nuevo modelo dura al menos
tres dı́as con una probabilidad de 90 %.
Ud. prueba 18 celulares durante tres dı́as y ninguno se descarga en ese lapso.
Denote xi = 1 si el celular i-ésimo no se descargó en los tres dı́as y x :i = 0 si no. Las variables
aleatorias correspondientes son los Xi . La probabilidad de que la baterı́a dure al menos 3 dı́as
se denota por θ.
a) ¿Qué distribución siguen los Xi ? Justifique.

b) Suponga que la previa para θ es uniforme en [0, 1]. Determine la posterior y el valor
que toma el estimador de Bayes. Ayuda: Recuerde que una uniforme en [0, 1] es una
Beta(1, 1).
Se realiza un segundo experimento, esta vez son 24 celulares y solo una baterı́a se descarga
en los primeros tres dı́as.
c) Usando la posterior en b) como previa, calcule una nueva posterior que incorpora la
nueva evidencia. Calcule también el nuevo valor que toma estimador de Bayes para θ.
d) Ahora, usando la previa original y la evidencia combinada de los dos experimentos,
calcule la posterior y el valor que toma el estimador de Bayes.
e) Compare los resultados que obtuvo en c) y d) y explique lo que obtuvo.
5
Soución:
a) Los Xi son i.i.d. Bernoulli con parámetro θ. En estricto rigor, la independencia es con-
dicional en θ pero esto no lo exigiremos ni lo hemos enfatizado.
b) Tenemos una previa Beta(1, 1) y observamos 30 éxitos y ningún fracaso. Luego la
posterior será una Beta(1 + 30, 1 + 0) = Beta(31, 1). Además, como la esperanza de
una Beta(α, β) es α/(α + β), el estimador de Bayes será 31/32.
c) La previa es una Beta(31, 1), la evidencia son 23 éxitos y un fracaso. Luego la nueva
posterior es una Beta(31 + 23, 1 + 1) = Beta(54, 2). Y el valor que toma el estimador
de Bayes es 54/(54 + 2) = 27/28.
d) La previa es una Beta(1, 1), la evidencia son 53 éxitos y un fracaso. Luego la nueva
posterior es una Beta(1 + 53, 1 + 1) = Beta(54, 2). Y el valor que toma el estimador de
Bayes es 54/(54 + 2) = 27/28.
e) Las partes c) y d) dan el mismo resultado porque las dos formas de proceder (partir de
nuevo y realizar en análisis con toda la evidencia vs. partir con la posterior como nueva
previa e incorporar solo la nueva evidencia) son equivalentes.
6. Evaluando distintos estimadores en regresión lineal simple (25 puntos)

Considere el modelo de regresión lineal simple sin constante aditiva (sin intercepto) que
revisamos en clase:
(Yi | X1 = x1 , ..., Xi = xi , ..., Xn = xn ) = (Yi | X = x) ∼ N(θxi , σ2 )
con i = 1, 2, ..., n y donde las distribuciones condicionales anteriores son independientes.

Considere los siguientes tres estimadores de θ:
n n
θ1 = ( ∑ xi )−1 ∑ Yi ,
b
i=1 i=1
n n
θ2 =
b ( xi2 )−1 xiYi ,
∑ ∑
i=1 i=1
n n
θ3 =
b (1 + xi2 )−1 xiYi .
∑ ∑
i=1 i=1
Asuma que ∑ni=1 xi ̸= 0, de modo que b

θ1 está bien definido. También le será útil en las partes
b) la desigualdad
1 n 2 1 n
∑ i n ∑ xi)2
n i=1
x > (
i=1
que se cumple para cualquier colección de reales x1 , ..., xn donde al menos dos xi son distintos
(lo cual puede suponer se cumple).
6
θ1 | X = x), E(b
a) (10 ptos.) Calcule E(b θ2 | X = x) y E(b θ3 | X = x). Para cada uno de los
estimadores determine si es insesgado o no.
b) (10 ptos) Determine Var(bθ1 | X = x), Var(bθ2 | X = x) y Var(bθ3 | X = x). ¿Cuál estimador
tiene la menor varianza?
c) (5 ptos) Suponga, solo para esta parte, que σ2 = b2 . En base al error cuadrático medio,
¿cuál estimador prefiere? Fundamente su respuesta.
Solución:
a) Tenemos
n n n n n n n n
θ1 | X = x) = E[( ∑ xi )−1 ∑ Yi ] = ( ∑ xi )−1 ∑ E(Yi ) = ( ∑ xi )−1 ∑ θxi = θ( ∑ xi )−1 ( ∑ xi ) = θ,
E(b
i=1 i=1 i=1 i=1 i=1 i=1 i=1 i=1
n n n n n n n n
θ2 | X = x) = E[( ∑ xi2 )−1 ∑ xiYi ] = ( ∑ xi2 )−1 ∑ xi E(Yi ) = ( ∑ xi2 )−1 ∑ θxi2 = θ( ∑ xi2 )−1 ( ∑ xi2 ) = θ,
E(b
i=1 i=1 i=1 i=1 i=1 i=1 i=1 i=1
n n n n n n
θ3 | X = x) = E[(1 + ∑ xi2 )−1 ∑ xiYi ] = (1 + ∑ xi2 )−1 ∑ θxi2 = (1 + ∑ xi2 )−1 ( ∑ xi2 )θ ̸= θ,
E(b
i=1 i=1 i=1 i=1 i=1 i=1
porque (1 + ∑ni=1 xi2 )−1 (∑ni=1 xi2 ) < 1.

Luego b
θ1 y b
θ2 son insesgados pero b θ3 no es insesgado.
b) Tenemos
n n n n
nσ2
θ1 | X = x) = Var[( ∑ xi )−1 ∑ Yi ] = ( ∑ xi )−2 ∑ Var(Yi ) =
Var(b ,
i=1 i=1 i=1 i=1 (∑ni=1 xi )2
n n n n
σ2
θ2 | X = x) = Var[( ∑ xi2 )−1 ∑ xiYi ] = ( ∑ xi2 )−2 ∑ xi2 σ2 =
Var(b ,
i=1 i=1 i=1 i=1 ∑ni=1 xi2
n n
∑ni=1 xi2
θ3 | X = x) = Var[(1 + ∑ xi2 )−1 ∑ xiYi ] =
Var(b σ2 .
i=1 i=1 (1 + ∑ni=1 xi2 )2
Que Var(bθ1 | X = x) > Var(b

θ2 | X = x) es consecuencia de la desigualdad que se men-
ciona en el enunciado.
También tenemos
2
∑ni=1 xi2 ∑ni=1 xi2

1
θ3 | X = x) < Var(b
Var(b θ2 | X = x) ⇐⇒ n < n 2 ⇐⇒ <1
2
(1 + ∑i=1 xi ) 2 ∑i=1 xi 1 + ∑ni=1 xi2
y esta última desigualdad efectivamente se cumple siempre.

c) Como son insesgados, el ECM de b θ1 y b
θ2 es igual a su varianza. Luego, por lo visto en
la parte anterior, el ECM de θ2 será menor que el de b
b θ1 .
7
Ahora calculamos el ECM de b θ3 .
Por lo visto en la parte a) y usando el supuesto según el cual σ2 = θ2 tenemos que
σ2
θ3 )]2 =
[b(θ; b .
(1 + ∑ni=1 xi2 )2
Sumando la expresión anterior a la obtenida en la parte b) concluimos que
σ2
θ3 ) =
ECM(θ; b .
1 + ∑ni=1 xi2
Finalmente, comparando la expresión anterior con el ECM de b θ2 , que es igual a la

varianza que obtuvimos en la parte b), concluimos que θ3 tiene el menor ECM.
b

Examen Primavera 2021 Solución

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Examen Primavera 2021 Solución

Cargado por

Copyright:

Formatos disponibles

Universidad de Chile — Facultad de Economı́a y Negocios

ENMES 250 — Estadı́stica II Todas las secciones

1. Esta parte consta de 6 preguntas con un máximo de 120 puntos.

3. Tiene 2 horas y 30 minutos para responder el control.

a) Determine la función de probabilidad de W1,1 . Calcule su esperanza y su varianza.

Pr(W2,1 = 0 | W1,1 = 1) = 1, Pr(W2,1 = 1 | W1,1 = 0) = 1.

2. Encuestas para la segunda vuelta (15 puntos)

a) Obtenga un intervalo de confianza (aproximado) del 95 % para la fracción de la pobla-

a) El intervalo aproximado de confianza es

b) El intervalo aproximado de confianza es

c) La primera encuesta es más favorable al candidato, pues el intervalo de confianza in-

3. Una buena noticia (15 puntos)1

a) Obtenga el valor que toma el e.m.v. de pt .

a) El e.m.v. en el modelo Bernoulli es la media muestral (no es necesario demostarlo).

4. Tanques alemanes con una observación (25 puntos)

a) Determine la función de verosimilitud L(θ; x).

a) L(θ; x) = 1/θ para θ = x, x + 1, x + 2, ... y L(θ; x) = 0 para otros valores de x.

5. Estimadores de Bayes y la baterı́a de los celulares (25 puntos)

a) ¿Qué distribución siguen los Xi ? Justifique.

6. Evaluando distintos estimadores en regresión lineal simple (25 puntos)

(Yi | X1 = x1 , ..., Xi = xi , ..., Xn = xn ) = (Yi | X = x) ∼ N(θxi , σ2 )

con i = 1, 2, ..., n y donde las distribuciones condicionales anteriores son independientes.

Asuma que ∑ni=1 xi ̸= 0, de modo que b

porque (1 + ∑ni=1 xi2 )−1 (∑ni=1 xi2 ) < 1.

Que Var(bθ1 | X = x) > Var(b

y esta última desigualdad efectivamente se cumple siempre.

Sumando la expresión anterior a la obtenida en la parte b) concluimos que

Finalmente, comparando la expresión anterior con el ECM de b θ2 , que es igual a la

También podría gustarte