Está en la página 1de 8

Universidad de Chile — Facultad de Economı́a y Negocios

ENMES 250 — Estadı́stica II Todas las secciones


Semestre Primavera 2021 Sábado, 20 de noviembre, 2021

Examen

Instrucciones

1. Esta parte consta de 6 preguntas con un máximo de 120 puntos.

2. Salvo que se indique explı́citamente lo contrario, todas las partes de una pregunta dan el
mismo puntaje.

3. Tiene 2 horas y 30 minutos para responder el control.

4. Asigne su tiempo de modo de dedicar suficiente tiempo a todas las preguntas. No dedique
demasiado tiempo a ninguna de ellas. Si asigna el mismo número de minutos que los puntos
que da cada pregunta, tendrá 30 minutos de libre disposición.

5. Sus respuestas deben contener todos los pasos intermedios para que el evaluador pueda estar
seguro de que llegó al resultado correcto sabiendo lo que hacı́a. Esto también le permitirá al
evaluador darle puntaje parcial cuando no obtenga la respuesta correcta.

6. Responda cada pregunta en una hoja distinta e indique cuál pregunta está respondiendo.

7. Este es un control a libro cerrado. No se permiten ayudas de ninguna especie, solo puede
usar el resumen oficial.

1
1. Probabilidades en un experimento aleatorizado emparejado (15 puntos)
Un experimento aleatorizado emparejado es un tipo de experimento aleatorizado donde las
unidades que participan en el estudio vienen en pares que comparten una caracterı́stica rele-
vante. Por ejemplo, cada par tiene el mismo sexo o la misma región de residencia o el mismo
nivel de ingreso. Lo clave de estos experimentos es que dentro de cada pareja se asigna una
unidad al grupo de tratamiento y la otra al grupo de control. Especı́ficamente, dentro de cada
par de unidades, se lanza una moneda justa para decidir qué miembro de la pareja es tratado
y cuál es el control.
Considere 15 pares de unidades que participan en un experimento aleatorizado emparejado.
Para cada unidad i en el par j en el estudio (con i = 1, 2 y j = 1, 2, ..., 15), definamos la
variable aleatoria Wi, j que toma el valor 1 si la unidad i en el par j es tratada y toma el valor
0 si la unidad i en el par j es control. Ası́, por ejemplo, W2,1 = 1 si la segunda unidad del
primer par es tratada y W2,1 = 0 si esta unidad es control.
A continuación consideramos el par 1 de modo que las variables aleatorias relevantes serán
W1,1 y W2,1 . Obviamente lo que sigue vale para los restantes pares también.

a) Determine la función de probabilidad de W1,1 . Calcule su esperanza y su varianza.


Ayuda: Comience por determinar qué valores pueden tomar estas variables aleatorias.
b) Calcule la función de probabilidad conjunta de W1,1 y W2,1 .
c) Definamos Nt como el número de tratados en este experimento. Calcule la función de
probabilidad de Nt .

Solución:
a) W1,1 puede tomar los valores 1 con probabilidad 1/2 y 0 con una probabilidad 1/2. Es
decir, W1,1 ∼ Ber( 12 ). Dado lo anterior: E(W1,1 ) = 12 y Var(W1,1 ) = 14 . Aunque no se
pide, lo mismo vale para todos los Wi, j .
b) Dentro del par 1, una unidad es tratada y la otra es control. Luego las variables aleato-
rias W1,1 y W2,1 no son independientes pues siempre una es cero y la otra es uno y solo
(W1,1 = 1,W2,1 = 0) y (W1,1 = 0,W2,1 = 1) tienen probabilidad estrictamente positiva.
Existen varias formas de calcular las probabilidades de los eventos anteriores. Una
nota que el evento (W1,1 = 1,W2,1 = 0) es igual al evento (W1,1 = 1), de modo que
Pr(W1,1 = 1,W2,1 = 0) = 21 . Otra es notar que

Pr(W2,1 = 0 | W1,1 = 1) = 1, Pr(W2,1 = 1 | W1,1 = 0) = 1.

De modo que
1 1
Pr(W1,1 = 1,W2,1 = 0) = Pr(W2,1 = 0 | W1,1 = 1) · Pr(W1,1 = 1) = 1 · = ,
2 2
1 1
Pr(W1,1 = 0,W2,1 = 1) = Pr(W2,1 = 1 | W1,1 = 0) · Pr(W1,1 = 0) = 1 · = .
2 2
2
c) Nt = 15 con probabilidad igual a 1 y Nt toma un valor distinto a 15 con probabilidad
igual a 0.

2. Encuestas para la segunda vuelta (15 puntos)


Pocos dı́as antes de las segunda vuelta presidencial, un candidato cuenta con dos encuestas
que cumplen con las condiciones ideales de una encuesta probabilı́stica. En la primera en-
cuesta la muestra aleatoria es de 3600 personas y lo prefieren 1872, es decir, un 52 %. En la
segunda la muestra es de 900 personas y lo prefieren 477, es decir, un 53 %.

a) Obtenga un intervalo de confianza (aproximado) del 95 % para la fracción de la pobla-


ción que apoya al candidato basado en la primera encuesta.
b) Obtenga un intervalo de confianza (aproximado) del 95 % para la fracción de la pobla-
ción que apoya al candidato basado en la segunda encuesta.
c) El candidato debe elegir una de las encuestas para hacerla pública. Sus asesores sugie-
ren que sea la segunda porque el porcentaje que lo apoya es mayor en esta encuesta. En
base a sus respuestas en las partes anteriores determine, basado en un análisis estadı́sti-
co serio, cuál encuesta es más favorable al candidato. Justifique.

Solución:

a) El intervalo aproximado de confianza es


1 1 1 1
[x − √ , x + √ ] = [0, 52 − , 0, 52 + ] = [0, 5033 , 0, 5367].
n n 60 60

b) El intervalo aproximado de confianza es


1 1 1 1
[x − √ , x + √ ] = [0, 53 − , 0, 53 + ] = [0, 4967 , 0, 5633].
n n 30 30

c) La primera encuesta es más favorable al candidato, pues el intervalo de confianza in-


cluye solo valores mayores que 0,5. Esto, a pesar de que el centro del intervalo (y el
e.m.v. de la fracción de la población que prefiere al candidato) es mayor para la segunda
encuesta.

3. Una buena noticia (15 puntos)1


Hace pocos dı́as (Financial Times, 5 de noviembre, 2021) Pfizer informó los resultados del
ensayo clı́nico de un nuevo fármaco para tratar el Covid-19, Paxlovid.
1 Las cifras que siguen difieren levemente de las verdaderas para facilitar sus cálculos.

3
En un experimento completamente aleatorizado con personas a las cuales se les acababa de
diagnosticar Covid-19, se administró la droga a 610 personas y el placebo a 610 personas.
Tres dı́as después hubo 5 hospitalizaciones entre los tratados y 43 entre los controles.
Los resultados para los tratados (1 si es hospitalizado, 0 si no) se modelan como variables
i.i.d. Bernoulli con parámetro pt . Los resultados para los controles (1 si es hospitalizado, 0
si no) se modelan como variables i.i.d. Bernoulli con parámetro pc . La eficacia del fármaco
se define como e = (pc − pt )/pc .
Ayuda: Si en una o más de las siguientes preguntas, una vez planteado el modelo estadı́stico,
sabe cuál es el e.m.v., no es necesario que lo derive.

a) Obtenga el valor que toma el e.m.v. de pt .


b) Obtenga el valor que toma el e.m.v. de pc .
c) Obtenga el valor que toma el e.m.v. de e.

Solución:

a) El e.m.v. en el modelo Bernoulli es la media muestral (no es necesario demostarlo).


Luego pbt = 5/610.
b) De manera análoga: pbc = 43/610.
c) Como los e.m.v. son invariantes:
pbc − pbt 43 − 5
eb = = = 88, 4 %.
pbc 43

4. Tanques alemanes con una observación (25 puntos)


Nota: Se puede responder las partes c) en adelante aun si no respondió las partes a) y b).

Repaso sobre la uniforme discreta: Una variable aleatoria Y sigue una distribución unifor-
me discreta en {1, 2, ..., N} si f (k) = 1/N para k = 1, 2, ..., N. Entonces:

1 1 2
E(Y ) = (N + 1), Var(Y ) = (N − 1).
2 12
Se dispone de una observación, x, de una v.a. X que sigue una uniforme discreta en {1, 2, ..., θ}.
El parámetro de interés es el entero estrictamente positivo θ.

a) Determine la función de verosimilitud L(θ; x).


b) Determine el e.m.v. de θ.

θ = 2X − 1.
θ = 2X y e
A continuación consideramos dos posibles estimadores de θ: b

4
c) Determine el sesgo de b
θ y el ECM de b
θ.
d) Muestre que e
θ es un estimador insesgado de θ y calcule su ECM.
e) Compare los ECM que obtuvo para b
θye
θ. ¿Cuál estimador es mejor?

Sol.:

a) L(θ; x) = 1/θ para θ = x, x + 1, x + 2, ... y L(θ; x) = 0 para otros valores de x.


b) Como 1/θ es decreciente en θ el valor del e.m.v. será x y el e.m.v. será X.
θ) = E(2X) − θ = 2E(X) − θ = 2 (θ + 1) − θ = 1.
c) b(θ; b 2
4 2
ECM(θ; b θ) = [b(θ; b 2
θ)] + Var(X) = 1 + 12 (θ2 − 1) = 1 + 13 (θ2 − 1) = 23 + θ3 .
d) E(eθ) = E(2X − 1) = 2E(X) − 1 = 2 · 21 (θ + 1) − 1 = θ.
ECM(θ; e θ) = Var(2X − 1) = Var(2X) = 4Var(X) = 13 (θ2 − 1) = 13 θ2 − 13 .
1 2 1 1 2 2
e) 3 θ − 3 < 3 θ + 3 ⇐⇒ ECM(θ; θ) < ECM(θ; θ).
e b
Concluimos que ECM(θ; e
θ) será menor a ECM(θ; b
θ) para cualquier valor de θ.

5. Estimadores de Bayes y la baterı́a de los celulares (25 puntos)


Una empresa que produce celulares asegura que la baterı́a de su nuevo modelo dura al menos
tres dı́as con una probabilidad de 90 %.
Ud. prueba 18 celulares durante tres dı́as y ninguno se descarga en ese lapso.
Denote xi = 1 si el celular i-ésimo no se descargó en los tres dı́as y x :i = 0 si no. Las variables
aleatorias correspondientes son los Xi . La probabilidad de que la baterı́a dure al menos 3 dı́as
se denota por θ.

a) ¿Qué distribución siguen los Xi ? Justifique.


b) Suponga que la previa para θ es uniforme en [0, 1]. Determine la posterior y el valor
que toma el estimador de Bayes. Ayuda: Recuerde que una uniforme en [0, 1] es una
Beta(1, 1).

Se realiza un segundo experimento, esta vez son 24 celulares y solo una baterı́a se descarga
en los primeros tres dı́as.

c) Usando la posterior en b) como previa, calcule una nueva posterior que incorpora la
nueva evidencia. Calcule también el nuevo valor que toma estimador de Bayes para θ.
d) Ahora, usando la previa original y la evidencia combinada de los dos experimentos,
calcule la posterior y el valor que toma el estimador de Bayes.
e) Compare los resultados que obtuvo en c) y d) y explique lo que obtuvo.

5
Soución:

a) Los Xi son i.i.d. Bernoulli con parámetro θ. En estricto rigor, la independencia es con-
dicional en θ pero esto no lo exigiremos ni lo hemos enfatizado.
b) Tenemos una previa Beta(1, 1) y observamos 30 éxitos y ningún fracaso. Luego la
posterior será una Beta(1 + 30, 1 + 0) = Beta(31, 1). Además, como la esperanza de
una Beta(α, β) es α/(α + β), el estimador de Bayes será 31/32.
c) La previa es una Beta(31, 1), la evidencia son 23 éxitos y un fracaso. Luego la nueva
posterior es una Beta(31 + 23, 1 + 1) = Beta(54, 2). Y el valor que toma el estimador
de Bayes es 54/(54 + 2) = 27/28.
d) La previa es una Beta(1, 1), la evidencia son 53 éxitos y un fracaso. Luego la nueva
posterior es una Beta(1 + 53, 1 + 1) = Beta(54, 2). Y el valor que toma el estimador de
Bayes es 54/(54 + 2) = 27/28.
e) Las partes c) y d) dan el mismo resultado porque las dos formas de proceder (partir de
nuevo y realizar en análisis con toda la evidencia vs. partir con la posterior como nueva
previa e incorporar solo la nueva evidencia) son equivalentes.

6. Evaluando distintos estimadores en regresión lineal simple (25 puntos)


Considere el modelo de regresión lineal simple sin constante aditiva (sin intercepto) que
revisamos en clase:

(Yi | X1 = x1 , ..., Xi = xi , ..., Xn = xn ) = (Yi | X = x) ∼ N(θxi , σ2 )

con i = 1, 2, ..., n y donde las distribuciones condicionales anteriores son independientes.


Considere los siguientes tres estimadores de θ:
n n
θ1 = ( ∑ xi )−1 ∑ Yi ,
b
i=1 i=1
n n
θ2 =
b ( xi2 )−1 xiYi ,
∑ ∑
i=1 i=1
n n
θ3 =
b (1 + xi2 )−1 xiYi .
∑ ∑
i=1 i=1

Asuma que ∑ni=1 xi ̸= 0, de modo que b


θ1 está bien definido. También le será útil en las partes
b) la desigualdad
1 n 2 1 n
∑ i n ∑ xi)2
n i=1
x > (
i=1
que se cumple para cualquier colección de reales x1 , ..., xn donde al menos dos xi son distintos
(lo cual puede suponer se cumple).

6
θ1 | X = x), E(b
a) (10 ptos.) Calcule E(b θ2 | X = x) y E(b θ3 | X = x). Para cada uno de los
estimadores determine si es insesgado o no.
b) (10 ptos) Determine Var(bθ1 | X = x), Var(bθ2 | X = x) y Var(bθ3 | X = x). ¿Cuál estimador
tiene la menor varianza?
c) (5 ptos) Suponga, solo para esta parte, que σ2 = b2 . En base al error cuadrático medio,
¿cuál estimador prefiere? Fundamente su respuesta.

Solución:
a) Tenemos
n n n n n n n n
θ1 | X = x) = E[( ∑ xi )−1 ∑ Yi ] = ( ∑ xi )−1 ∑ E(Yi ) = ( ∑ xi )−1 ∑ θxi = θ( ∑ xi )−1 ( ∑ xi ) = θ,
E(b
i=1 i=1 i=1 i=1 i=1 i=1 i=1 i=1

n n n n n n n n
θ2 | X = x) = E[( ∑ xi2 )−1 ∑ xiYi ] = ( ∑ xi2 )−1 ∑ xi E(Yi ) = ( ∑ xi2 )−1 ∑ θxi2 = θ( ∑ xi2 )−1 ( ∑ xi2 ) = θ,
E(b
i=1 i=1 i=1 i=1 i=1 i=1 i=1 i=1
n n n n n n
θ3 | X = x) = E[(1 + ∑ xi2 )−1 ∑ xiYi ] = (1 + ∑ xi2 )−1 ∑ θxi2 = (1 + ∑ xi2 )−1 ( ∑ xi2 )θ ̸= θ,
E(b
i=1 i=1 i=1 i=1 i=1 i=1

porque (1 + ∑ni=1 xi2 )−1 (∑ni=1 xi2 ) < 1.


Luego b
θ1 y b
θ2 son insesgados pero b θ3 no es insesgado.
b) Tenemos
n n n n
nσ2
θ1 | X = x) = Var[( ∑ xi )−1 ∑ Yi ] = ( ∑ xi )−2 ∑ Var(Yi ) =
Var(b ,
i=1 i=1 i=1 i=1 (∑ni=1 xi )2

n n n n
σ2
θ2 | X = x) = Var[( ∑ xi2 )−1 ∑ xiYi ] = ( ∑ xi2 )−2 ∑ xi2 σ2 =
Var(b ,
i=1 i=1 i=1 i=1 ∑ni=1 xi2
n n
∑ni=1 xi2
θ3 | X = x) = Var[(1 + ∑ xi2 )−1 ∑ xiYi ] =
Var(b σ2 .
i=1 i=1 (1 + ∑ni=1 xi2 )2

Que Var(bθ1 | X = x) > Var(b


θ2 | X = x) es consecuencia de la desigualdad que se men-
ciona en el enunciado.
También tenemos
2
∑ni=1 xi2 ∑ni=1 xi2

1
θ3 | X = x) < Var(b
Var(b θ2 | X = x) ⇐⇒ n < n 2 ⇐⇒ <1
2
(1 + ∑i=1 xi ) 2 ∑i=1 xi 1 + ∑ni=1 xi2

y esta última desigualdad efectivamente se cumple siempre.


c) Como son insesgados, el ECM de b θ1 y b
θ2 es igual a su varianza. Luego, por lo visto en
la parte anterior, el ECM de θ2 será menor que el de b
b θ1 .

7
Ahora calculamos el ECM de b θ3 .
Por lo visto en la parte a) y usando el supuesto según el cual σ2 = θ2 tenemos que

σ2
θ3 )]2 =
[b(θ; b .
(1 + ∑ni=1 xi2 )2

Sumando la expresión anterior a la obtenida en la parte b) concluimos que

σ2
θ3 ) =
ECM(θ; b .
1 + ∑ni=1 xi2

Finalmente, comparando la expresión anterior con el ECM de b θ2 , que es igual a la


varianza que obtuvimos en la parte b), concluimos que θ3 tiene el menor ECM.
b

También podría gustarte