Está en la página 1de 7

Pontificia Universidad Católica de Chile

Facultad de Ciencias Económicas y Administrativas

Primer Semestre 2019

Curso : Inferencia Estadı́stica


Sigla : EAS201a
Profesores : M Ignacia Vicuña (Sec 1), Cristian Vásquez (Sec 2), Rafael Águila (Sec 3)

Pauta Prueba 2
Problema 1

Hoy en dı́a es imprescindible contar con una buena conexión a internet en nuestra casa. El número de
aparatos electrónicos que se conectan a una red de WiFi es cada vez mayor. El problema es que a veces la
señal del router no es la óptima. Suponga que Ud. se cambió recién de casa y no sabe que tipo de conexión
a internet funcionará mejor en su hogar. Para ello planea hacer un estudio de comparación, contratando el
primer mes el servicio de Movistar y el segundo mes VTR. En ambos meses (considere de 30 dı́as) se registró
diariamente la velocidad de la señal de la red WiFi en la hora peak de uso de artı́culos tecnológicos. Se obtuvo
que la velocidad promedio muestral para el servicio Movistar fue de 1300 Mbps y para el servicio VTR fue
de 1450 Mbps y que la desviación estándar muestral para Movistar fue de 100 Mbps y de 120 Mbps para
VTR. Suponiendo que en ambos servicios la varianza poblacional es la misma y además que la velocidad de
la señal de la red WiFi puede ser modelada con una distribución Normal.
(a) [3.0 Puntos] Si µX y µY son la velocidad media de la señal de red WiFi para el servicio de Movistar
y VTR respectivamente. Proponga estimadores puntuales para estimar la velocidad media de la señal
para cada uno de los servicios y un estimador para la variabilidad. En base a dichos estimadores
construya una función pivote para estimar la cantidad µX − µY y encuentre su distribución. Justifique
cada uno de sus pasos.
(b) [3.0 Puntos] Con el pivote determinado en la parte (a), encuentre paso a paso un intervalo unilateral
de la forma (−∞, b) de 95 % de confianza para el parámetro µX − µY . En base a la muestra, ¿Puede
concluir que la velocidad promedio de la señal de la red WiFi es mayor para el servicio de VTR?
Solución:
(a) Sea X1 , ..., Xn la muestra de la velocidad de la señal de la red WiFi para el servicio de Movistar. Sea
Y1 , ..., Yn la muestra de la velocidad de la señal de la red WiFi para el servicio de VTR, donde para
2
ambas muestras n = 30. Por enunciado se tiene que σX = σY2 = σ 2 y además que Xi ∼ N (µX , σ 2 ) e
2
Yi ∼ N (µY , σ ) para i = 1, ..., n.

Un estimador puntual para estimar µX y µY son las medias muestrales, es decir, µc X = X y µ cY = Y.


[0.3 Ptos]
En el caso de la varianza, un estimador puntual es el promedio ponderado de las varianzas muestrales, es
2 2
(n−1)SX +(n−1)SY 1
Pn 1
Pn
decir Sp2 = 2n−2
2
, donde SX = n−1 2 2
i=1 (Xi − X) y SY = n−1
2
i=1 (Yi − Y ) . [0.3 Ptos]
 2
  2

A partir de dichos estimadores, se tiene que X ∼ N µX , σn y Y ∼ N µY , σn , [0.3 Ptos]luego

2σ 2
 
X − Y − (µX − µY )
X −Y ∼N µX − µY , ⇒ p ∼ N (0, 1) [0.5 Ptos]
n 2σ 2 /n
2 2
SX (n−1) SY (n−1)
Además, σ2 ∼ χ2n−1 y σ2 ∼ χ2n−1 y ambas muestras son independientes, [0.3 Ptos]luego
2
SX (n − 1) SY2 (n − 1) Sp2 (2n − 2)
+ = =∼ χ22n−2 [0.5 Ptos]
σ2 σ2 σ2

EAS201A - Inferencia Estadı́stica 1 Primer Semestre 2019


Luego, una función pivote para µX − µY está dada por
X−Y −(µX −µY )
√ 2
2σ /n X − Y − (µX − µY )
T = q 2 = q [0.3 Ptos]
Sp (2n−2)
σ 2 (2n−2)
Sp n2

cuya distribución es t-student con 2n − 2 grados de libertad. [0.5 Ptos]


(b) Alternativa 1: Trabajar directamente con el intervalo unilareral de cota superior. Ası́ queremos en-
contrar el valor de a tal que

P (a < T ) = 0.95 [0.4 Ptos]

Luego como T ∼ t2n−2 se tiene que a = t2n−2,0.05 = t58,0.05 ≈ −1.64 [0.3 Ptos]. Reemplazando se
obtiene
 
X − Y − (µX − µ Y )
P −1.64 < q  = 0.95 [0.3 Ptos]
Sp n2
r !
2
P −1.64 · Sp < X − Y − (µX − µY ) = 0.95 [0.3 Ptos]
n
r !
2
P −(X − Y ) − 1.64 · Sp < −(µX − µY ) = 0.95 [0.3 Ptos]
n
r !
2
P X − Y + 1.64 · Sp > µX − µY = 0.95 [0.3 Ptos]
n

Luego, un intervalo bilateral de cota superior de confianza 95 % esta dado por


r !
2
IC(95 %) = −∞, X − Y + 1.64 · Sp [0.4 Ptos]
n

Alternativa 2: Construir un IC bilateral simétrico para µX − µY y luego modificarlo para obtener el


unilateral de cota superior. Ası́,

P (a < T < b) = 0.95 [0.4 Ptos]

como T tiene distribución t-student se tiene que a = t2n−2,0.025 y b = t2n−2,0.975 , donde 2n − 2 = 58,
luego buscando en la tabla t-student a = t58,0.025 ≈ −1.96 y b = t58,0.975 ≈ 1.96. [0.3 Ptos] De esta
manera,
 
X − Y − (µX − µY )
P −1.96 < q < 1.96 = 0.95 [0.3 Ptos]
2
Sp n
r r !
2 2
P −1.96 · Sp < X − Y − (µX − µY ) < 1.96 · Sp = 0.95 [0.3 Ptos]
n n
r r !
2 2
P −(X − Y ) − 1.96 · Sp < −(µX − µY ) < −(X − Y ) + 1.96 · Sp = 0.95 [0.3 Ptos]
n n
r r !
2 2
P X − Y + 1.96 · Sp > (µX − µY ) > (X − Y ) − 1.96 · Sp = 0.95 [0.3 Ptos]
n n

EAS201A - Inferencia Estadı́stica 2 Primer Semestre 2019


Por lo tanto un IC bilateral de 95 % para µX − µY esta dado por
r r !
2 2
X − Y − 1.96 · Sp , X − Y + 1.96 · Sp
n n

Luego, un intervalo bilateral de cota superior de confianza 95 % esta dado por


r !
2
IC(95 %) = −∞, X − Y + 1.64 · Sp [0.4 Ptos]
n

A partir de la muestra se tiene que X = 1300, Y = 1450.


(30−1)·1002 +(30−1)1202
Además, Sp2 = 60−2 = 12200. Luego,
!

r
2
IC(95 %) = −∞, 1300 − 1450 + 1.64 · 12200 = (−∞, −103.2288) [0.4 Ptos]
30

Como el cero no está incluido en el intervalo, se concluye con un 95 % de confianza que µX − µY < 0, es
decir, que la velocidad media del servicio VTR es mayor que la velocidad media del servicio Movistar.
[0.3 Ptos]

EAS201A - Inferencia Estadı́stica 3 Primer Semestre 2019


Problema 2

A finales del año pasado, la cadena de supermercados Walmart lanzó la primera tienda del paı́s que es
completamente de autoservicio, o sea, donde los mismos clientes deben escanear el precio de los productos,
pagar, y posteriormente embolsarlos. El local escogido es un Lı́der Express que cuenta con cinco cajas de
autoservicio disponibles, todas con una fila común de espera. Con este nuevo sistema se pretende disminuir
el tiempo de espera de los clientes y para Walmart será satisfactorio esta nueva implementación si el tiempo
promedio de espera de un cliente es menor a 8 minutos. Para ello se evaluó una muestra de 300 clientes y se
les registró el tiempo de espera hasta poder ser atendidos en una caja de autoservicio, cuyo tiempo promedio
fue de 7.6 minutos. Se sabe de estudios anteriores que la desviación estándar poblacional es de 1.2 minutos.
(a) [1.5 Puntos] Plantee las hipótesis necesarias y un estadı́stico del test para evaluar si el nuevo sistema de
cajas de autoservicio implementado por Walmart es satisfactorio. ¿Qué distribución tiene el estadı́stico
bajo la hipótesis nula?
(b) [1.5 Puntos] Encuentre una región crı́tica del test con un nivel de significancia de 0.1, y en base a lo
obtenido en la muestra concluya.
(c) [1.5 Puntos] En base a la región crı́tica planteada en (b), encuentre la probabilidad de cometer un
Error de tipo II cuando el tiempo medio de espera es de 7.8 minutos.
(d) [1.5 Puntos] Suponga que no se tiene registro de los datos de la muestra, sólo le reportaron el valor-p
del test cuyo valor es 0.023. A partir de dicha información encuentre el valor observado del estadı́stico
del test y con un 5 % de significancia concluya.
Solución:

(a) Sea µ el tiempo medio de espera de un cliente. Las hipótesis a testear son

H0 : µ ≥ 8 H1 : µ < 8 [0.5 Ptos]

Como la varianza poblacional σ 2 es conocida, se tiene que el estadı́stico del test está dado por

X − µ0 X −8
T = = [0.5 Ptos]
√σ √σ
n n

tiene distribución N(0,1) bajo H0 . [0.5 Ptos]


(b) La región crı́tica del test es de la forma T < c, donde para un nivel de sifnificancia de α = 0.1 se tiene
que
α = P (T < c|H0 ) ⇒ c = zα = −z1−α = −z0.9 = −1.28 [0.3 Ptos]
Luego se rechaza H0 si T < −1.28 [0.4 Ptos]. A partir de la muestra se obtiene que tobs = −5.773,
[0.4 Ptos] luego como tobs < −1.28 existe evidencia para rechazar H0 . Con un nivel de significancia
de 10 % se puede decir que el tiempo medio de espera de un cliente es menor a 8 minutos. [0.4 Ptos]

(c) La probabilidad de error tipo II cuando µ = 7.8 está dada por

β(7.8) = P (T > −1.28|µ = 7.8) [0.3 Ptos]


!
X −8
= 1−P σ < −1.28|µ = 7.8

n

X−8
Note que √σ bajo H1 no tiene distribución N(0,1) si no que bajo H1 en particular para µ = 7.8 se
n

EAS201A - Inferencia Estadı́stica 4 Primer Semestre 2019


X−7.8
tiene que √σ distribuye aproximadamente N(0,1). De esta manera,
n

!
X −8
β(7.8) = 1−P < −1.28 µ = 7.8 [0.3 Ptos]

√σ
n
 
σ
= 1−P X < −1.28 √ + 8 µ = 7.8

n
√σ + 8 − 7.8
!
X − 7.8 −1.28 n
= 1−P < µ = 7.8 [0.3 Ptos]

√σ σ √
n n
!
0.2
= 1 − Φ −1.28 + [0.3 Ptos]
√σ
n

Luego evaluando en los valores de la muestra n = 300 y σ = 1.2 se tiene

β(7.8) = 1 − Φ(1.61) = 1 − 0.9463011 = 0.0536989 [0.3 Ptos]

(d) Sea tobs el valor observado del estadı́stico del test. Luego si el valor-p del test es igual a 0.023, se tiene
que

valor − p = P (T < tobs |H0 ) [0.5 Ptos]


0.023 = P (T < tobs |H0 ) ⇒ tobs = z0.023 = −z0.977 = −1.995 [0.5 Ptos]

De esta manera el estadı́stico observado del test es tobs = −1.995. Para un nivel de significancia de
α = 0.05 se tiene que valor-p = 0.023< 0.05, se rechaza H0 . Luego con un 5 % de significancia se puede
decir que el tiempo medio de espera de un cliente con el uso de cajas autoservicio es menor a 8 minutos.
[0.5 Ptos]

EAS201A - Inferencia Estadı́stica 5 Primer Semestre 2019


Problema 3

Airbnb es una empresa que ofrece una plataforma de software dedicada a la oferta de alojamientos mediante
la cual los anfitriones pueden publicitar y contratar el arriendo de sus propiedades. Los arrendatarios y
huéspedes pueden valorarse mutuamente, como referencia para futuros usuarios. Airbnb tiene una oferta de
2.000.000 de propiedades en 192 paı́ses y 33.000 ciudades. Desde su creación en noviembre de 2008 hasta
junio de 2012 se realizaron 10 millones de reservas. En esta oportunidad, usted dispone de una muestra de
300 datos de las ofertas de airbnb.

(a) [1.0 Puntos] Reporte un intervalo de confianza al 90 % para la media y desviación estándar del
“precio” de las habitaciones.
(b) [1.0 Puntos] Obtenga el promedio muestral y la desviación estándar muestral del “precio” de la oferta.

(c) [1.0 Puntos] Encuentre un intervalo de confianza al 95 % para la diferencia de las medias entre el
precio de “habitación privada” y el de “hogar completo”. Fundamente sus supuestos y comente si
ambas medias podrı́an ser iguales.
(d) [1.5 Puntos] Indique por medio de un test de hipótesis con qué nivel de significancia se puede eviden-
ciar que la media del precio de “hogar completo” es superior a los 130 euros. Explicite las hipótesis y
concluya justificadamente.
(e) [1.5 Puntos] Realice un test de hipótesis para evaluar si la proporción de ofertas de “hogares” com-
pletos es distinto al 55 %. Utilice un 5 % de significancia.

> A = precio[tipo_hogar=="Hogar completo"]


> B = precio[tipo_hogar=="Habitación compartida"] > t.test(C,A, var.equal=FALSE, conf.level=0.95)$conf.int
> C = precio[tipo_hogar=="Habitación privada"] -104.78924 -9.696752

> t.test(precio, conf.level = 0.9)$conf.int > t.test(A, mu=130, alternative="greater", conf.level=0.95)


82.46285 99.57048 t = 1.2267, df = 147, p-value = 0.1109

> t.test(precio, conf.level = 0.95)$conf.int > t.test(A, mu=130, alternative="greater", conf.level=0.90)


80.81445 101.21888 t = 1.2267, df = 147, p-value = 0.1109

> sigma.test(precio, conf.level = 0.9)$conf.int > t.test(A, mu=130, alternative="less", conf.level=0.95)


7083.772 9274.275 t = 1.2267, df = 147, p-value = 0.8891

> sigma.test(precio, conf.level = 0.95)$conf.int > prop.test(length(A), length(tipo_hogar),p=0.55 ,alternative=


6911.824 9529.158 "two.sided", conf.level = 0.95)
X-squared = 3.6667, df = 1, p-value = 0.05551
> var.test(A,B, conf.level=0.95)$conf.int
0.98353330 1.57596930 > prop.test(length(B), length(tipo_hogar),p=0.55 ,alternative=
"two.sided", conf.level = 0.95)
> var.test(C,A, conf.level=0.95)$conf.int X-squared = 346.94, df = 1, p-value < 2.2e-16
0.62736499 0.85237343
> prop.test(length(C), length(tipo_hogar),p=0.55 ,alternative=
> t.test(A,B, var.equal=TRUE, conf.level=0.95)$conf.int "less", conf.level = 0.95)
12.52431 221.20542 X-squared = 3.6667, df = 1, p-value = 0.02776

> t.test(C,A, var.equal=TRUE, conf.level=0.95)$conf.int > qchisq(0.95, 299)


-114.72739 0.582936 340.3279

> t.test(A,B, var.equal=FALSE, conf.level=0.95)$conf.int > qchisq(0.975, 299)


98.60166 135.12807 348.7943

EAS201A - Inferencia Estadı́stica 6 Primer Semestre 2019


Solución:
(a) De los resultados se tiene que IC(µ) = < 82.46285 , 99.57048 >. [0.5 Ptos] Luego, para el de la
desviación se
√ debe aplicar
√ la función de raı́z del intervalo de confianza de la varianza, y se obtiene que
IC(σ) =< 7083.772 , 9274.275 > = < 84.16515 ; 96.30304 > [0.5 Ptos]

(b) Del intervalo de confianza de la media se obtiene el punto medio:

82.46285 + 99.57048
X̄ = = 91.01667 [0.5 Ptos]
2
Mientras que del intervalo de la varianza al 90 %, tomando el lı́mite inferior, se sabe que:

(n − 1)S 2 (300 − 1)S 2


= = 7083.772 → S 2 = 8062.894 [0.5 Ptos]
χ21− α χ20.95
2

Y luego, S = 89.79.
(c) Tomando los objetos A y C, se puede ver que el intervalo de confianza de la razón de sus varianzas es
< 0.62736499 , 0.85237343 >, [0.25 Ptos] por lo tanto, como el 1 no pertenece al intervalo, se podrı́a
suponer que las varianzas de ambas poblaciones es desconocida y distinta. [0.25 Ptos]
Luego, el intervalo de confianza para la diferencia de medias es < −104.78924 , −9.696752 > [0.25
Ptos] y por tanto, como el 0 no pertenece al intervalo, las medias podrı́an ser distintas. [0.25 Ptos]
(d) Notar que lo buscado es
H0 : µ = 130 vs H1 : µ > 130 [0.5 Ptos]
Donde, según el test se tiene que valor-p es 0.1109. [0.5 Ptos]Entonces, para una significancia α >
0.1109 se rechazarı́a la hipótesis nula, y queda evidencia a favor de µ > 130. [0.5 Ptos]
(e) Notar que:
H0 : π = 0.55 vs H1 : π 6= 0.55 [0.5 Ptos]
Luego, como valor-p = 0.05551 [0.5 Ptos] > 0.05 = α, entonces no existe evidencia estadı́stica sufi-
ciente para rechazar la hipótesis nula, y por tanto la oferta podrı́a ser un 55 %, al 5 % de significancia.
[0.5 Ptos]

EAS201A - Inferencia Estadı́stica 7 Primer Semestre 2019

También podría gustarte