Está en la página 1de 5

Universidad Técnica Federico Santa Marı́a

Departamento de Matemática
Casa Central Prof. Ronny Vallejos

MAT 041 – PROBABILIDAD Y ESTADÍSTICA


Guı́a N◦ 5

1. Sea X1 , . . . , Xn i.i.d. con una función de densidad


1
f (x|θ) = , 0 ≤ x ≤ θ, θ > 0
θ
a. Estimar θ usando el método de los momentos y el de máxima verosimilitud. R: θ̂ M = 2X y
θ̂ MV = máx{X1 , . . . , Xn }
b. Calcular la media y la varianza de los dos estimadores.
θ2 nθ2
R: E[θ̂ M ] = θ, E[θ̂ MV ] = n+1
n
θ, V[θ̂ M ] = 3n y V[θ̂ MV ] = (n+2)(n+1)2.

c. ¿Cuál estimador uno deberı́a preferir? R: Si n es grande, uno deberı́a preferir θ̂ MV .


2. Sea X1 , . . . , Xn una muestra aleatoria de una población con función de cuantı́a

P(X = x) = θ x (1 − θ)1−x , x = 0 ó 1, 0 ≤ θ ≤ 1/2


Encontrar el estimador de los momentos y el EMV de θ. R: θ̂ M = X y θ̂ MV = mı́n{X, 1/2}, cuando
X > 1/2 y θ̂ MV = X ,cuando X ≤ 1/2
3. Sea X1 , . . . , Xn una muestra aleatoria de la función de densidad llamada Gausiana inversa
 λ 1/2
f (x|µ, λ) = 3
exp{−λ(x − µ)2 /(2µ2 x)}, x>0
2πx
Mostrar que los EMV de µ y λ son:
n
µ̂ MV = X y λ̂ MV = Pn 1 1
i=1 Xi − X

4. Consideremos la variable aleatoria cuya función de densidad


1 1
f (x|θ) = e− θ x , x ≥ 0, θ > 0
θ
Supongamos que disponemos de dos estimadores posible de θ; basados en muestras aleatorias simples
de tres elementos:
x1 + x2 + x3 x1 + x2 + x3
θ1 = y θ2 =
2 4
a. Deducir si estos estimadores son insesgados y, si procede calcular su sesgo. R: Ambos son
sesgados. S esgo(θ1 ) = 12 θ y S esgo(θ2 ) = 14 θ
b. Deducir cuál de estos estimadores es más eficiente. R: El segundo es mas eficiente pues tiene
menor varianza.
c. Seleccionar cuál de ellos es mejor estimador. R: El segundo pues tiene menor sesgo y menor
dispersión.
d. Calcular el error cuadrático medio de ambos estimadores. R: ECM(θ1 ) = θ2 y ECM(θ2 ) = 14 θ2 .
e. Si consideramos muestra de n elementos y los estimadores
Pn Pn
i=1 xi xi
θ1 = y θ2 = i=1
n−1 n+1
¿Son estos estimadores consistentes? R: Ambos son consistentes.

1
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática
Casa Central Prof. Ronny Vallejos

5. Sea X1 , X2 y X3 una muestra aleatoria de tamaño tres de una distribución uniforme(θ, 2θ), donde θ > 0.
a. Encontrar el estimador de los momentos de θ. R: θ̂ M = 2X/3
b. Encontrar el EMV y encontrar k tal que E(kθ̂ MV ) = θ
R: θ̂ MV = (1/2) máx{X1 , . . . , Xn } y k = (2n + 2)/(2n + 1).
6. Suponga que las variables aleatorias Y1 , . . . , Yn satisfacen

Yi = βxi + i , i = 1, . . . , n
donde x1 , . . . , xn son constantes fijas y 1 , . . . , n son i.i.d. N(0, σ2 ), σ2 es desconocido.
Pn
xy
a. Encontrar el EMV de β, y mostrar que es un estimador insesgado de β. R: β̂ = Pi=1 n
i i
2
i=1 xi
b. Encontrar la distribución del EMV de β. β̂ ∼ N(β, σ / i=1 xi ).
2 Pn 2

c. Mostrar que ni=1 Yi / ni=1 xi es un estimador insesgado de β.


P P
d. Calcular la varianza exacta de ni=1 Yi / ni=1 xi y compararla con la varianza del EMV.
P P
R: V ni=1 Yi / ni=1 xi = σ2 /(nx2 ) y V(β̂) = σ2 / ni=1 xi2 .
P P  P

7. Sea X1 , . . . , Xn i.i.d. con una función de densidad

f (x|θ) = θxθ−1 , 0 ≤ x ≤ 1, 0 < θ < ∞


a. Encontrar el EMV de θ. R: θ̂ MV = (− 1n ni=1 logxi )−1
P
b. Mostrar que la varianza del EMV converge a cero cuando n tiende al infinito.
2
R:V[θ̂ MV ] = (n−1)n2 (n−2) θ2
c. Encontrar el estimador de los momentos de θ. R: θ̂ M = ni=1 Xi /(n − ni=1 Xi ).
P P

8. Considere los datos de pesos en gramos del contenido de 16 cajas de cereal que se seleccionaron de
un proceso de llenado con propósito de verificar el peso promedio
506 508 499 503 504 510 497 512
514 505 493 496 506 502 509 496
Si el peso de cada caja es una variable aleatoria normal.
a. Considere una desviación estándar σ = 5g, obtener intervalos de confianza del 90,95 y 99 % para
la media de llenado de este proceso. R: [501,69 ; 505,81] , [501,30 ; 506,20] y [500,53 ; 506,97]
b. Considere que se desconoce la varianza, obtener intervalos de confianza del 90,95 y 99 % para la
media de llenado de este proceso. R: [501,03 ; 506,47] , [500,45 ; 507,05] y [499,18 ; 508,32]
9. Para llevar a cabo un estudio de contaminación de minas ácidas se eligieron 2 estaciones de muestreo
independientes: una que se localiza corriente abajo del punto de descarga ácida de la mina y la otra
ubicada corriente arriba. Para 12 muestras mensuales reunidas en la estación corriente abajo el ı́ndice
de diversidad de especies tuvo un valor medio de x1 = 3,11 y una desviación estándar de s1 = 0,771;
mientras que 10 muestras reunidas mensualmente en la estación corriente arriba tuvieron un valor
medio del ı́ndice x2 = 2,04 y una desviación estándar de s2 = 0,448. Calcule un intervalo de confianza
del 90 % para la diferencia entre las medias de la población de los dos sitios, suponiendo que las
poblaciones se distribuyen de forma aproximadamente normal y que tienen varianzas iguales.
R: [0,593 ; 1,547]
10. Un fabricante asegura, a una compañı́a que le compra un producto en forma regular, que el porcen-
taje de productos defectuosos no es mayor del 5 %. La compañı́a decide comprobar la afirmación del
fabricante seleccionando, de su inventario, 200 unidades de este producto y probándolas. ¿Deberá sos-
pechar la compañı́a de la afirmación del fabricante si se descubren un total de 19 unidades defectuosas
en la muestra? R: [0,05436 ; 0,1356] , por lo que se puede sospechar de la afirmación del fabricante.
2
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática
Casa Central Prof. Ronny Vallejos

11. En estudio para estimar la diferencia en la cantidad de ortofósforo quı́mico medido en dos estaciones
diferentes del rı́o James. Se reunieron 15 muestras de la estación 1 y 12 muestras de la estación 2.
Las 15 muestras de la estación 1 tuvieron un contenido promedio de ortofósforo de 3,84 miligramos
por litro y una desviación estándar de 3,07 miligramos por litro; en tanto que las 12 muestras de la
estación 2 tuvieron un contenido promedio de 1,49 miligramos por litro y una desviación estándar de
0.80 miligramos por litro.
a. Calcule un intervalo de confianza de 95 % R:[0,6 ; 4,1] para la diferencia en el contenido pro-
medio verdadero de ortofósforo en estas dos estaciones. Suponga que las observaciones provienen
de poblaciones normales con varianzas diferentes.
b. suponiendo que las varianzas normales de la población son diferentes. Justifique esta suposición
construyendo intervalos de confianza del 98 % para σ21 /σ22 y para σ1 /σ2 , donde σ21 y σ22 son
las varianzas de la población del contenido de ortofósforo en la estación 1 y en la estación 2,
respectivamente. R: [1,851 ; 7,549], por lo que no se permite que la posibilidad de que σ1 /σ2 =
1.
12. Un proceso produce cierta clase de cojinetes de bola cuyo diámetro interior es de 3 cm. Se seleccionan,
en forma aleatoria, 12 de esos cojinetes y se miden sus diámetros internos, los cuales son mostrado en
la siguiente tabla

3,01 3,05 2,99 2,99 3,00 3,02


2,98 2,99 2,97 2,97 3,02 3,01
Suponiendo que el diámetro es una variable aleatoria normal, determinar un intervalo de confianza del
99 % para la varianza de σ2 . R:[0,0002246 ; 0,0023079]
13. Un ingeniero civil analiza la resistencia a la compresión del concreto. La resistencia está distribui-
da aproximadamente normal, con una varianza a 1000 [psi2 ]. Al tomar una muestra aleatoria de 12
probetas, se ha encontrado el siguiente intervalo de confianza para la verdadera media a la compresión:

[3232, 11; 3267, 99]


a. ¿Cuál es el nivel de confianza del intervalo?. R: 95 %
b. ¿Con qué nivel de confianza se puede afirmar que la verdadera resistencia media sea superior a
3232, 84 [psi]? R: 94 %
c. Supóngase que se desea estimar la resistencia media a la compresión con un error de estimación
menor que 15 [psi] para un nivel de confianza de 99 % ¿Qué tamaño de muestra deberı́a emplearse
para este fin? R: n ≥ 30.
14. El consumo de gasolina de cierto tipo de vehı́culos se distribuye aproximadamente normal. Si una
muestra aleatoria de 64 vehı́culos tiene un consumo promedio de 16 [millas/galón] con una desviación
estándar de 6 [millas/galón].
a. Encuentre un intervalo de confianza del 92 % para el consumo medio de gasolina de todos los
vehı́culos de este tipo. R: [14,6725;17,3275]
b. Con un 95 % de confianza. ¿Cuál es el error si el consumo medio es tomado en 16 [millas/galón]?
R: 1.4985
c. Determine un intervalo de confianza del 94 % para la varianza. R: [26,452; 51,97]
d. ¿De qué tamaño debe ser la muestra si queremos tener un 95 % de seguridad que la media no
difiera en más de 0,5 [millas/galón] de la media verdadera? R: n ≥ 575

3
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática
Casa Central Prof. Ronny Vallejos

15. De experiencias pasadas se sabe que la desviación estándar de las estaturas de niños de 5to básico es
de 5[cm].
a. Se seleccionan 36 niños, observándose una media de 130[cm], construya un intervalo de confianza
del 95 % para la estatura media de la población. R: [128,36 ; 131,63]
b. ¿Cuál es el tamaño de la muestra para que el intervalo de confianza

[130 − 0, 95; 130 + 0, 95]


tenga un 95 % de confianza? R: n = 107.
16. Suponga que en cierta ciudad sólo hay dos estaciones de televisión: el canal 6 y el canal 10. Se piensa
que para las noticias de la tarde el auditorio se encuentra dividido en partes iguales para ambos canales.
Una compañı́a se interesa en probar la afirmación de que la proporción de televidentes para las noticias
de la tarde es igual a 0,5 para ambos canales. La compañı́a no posee ninguna información a priori para
sugerir una alternativa unilateral por lo que decida probar el siguiente test de hipótesis

H0 : p = 0, 5
H1 : p , 0, 5
La compañia encuesta a 18 residentes seleccionados al azar y pregunta qué canal prefieren para ver
las noticias de la tarde. El número X indica que el canal 6 es el que se ha seleccionado. Se proponen
las siguientes dos pruebas:

Prueba A: Rechazar H0 si X ≤ 4 ó X ≥ 14

Prueba B: Rechazar H0 si X ≤ 5 ó X ≥ 13
Si la compañı́a piensa en tolerar un tamaño máximo de 0,1 para el error de tipo I, determinar la mejor
prueba a emplear para decidir entre H0 y H1 . R: La prueba B es mejor que la prueba A.
17. Considere los siguientes datos que representan los tiempos de armado de 20 unidades seleccionadas
aleatoriamente
9,8 10,4 10,6 9,6 9,7 9,9 10,9 11,1 9,6 10,2
10,3 9,6 9,9 11,2 10,6 9,8 10,5 10,1 10,5 9,7
Suponga que el tiempo necesario para armar una unidad es una variable aleatoria normal con media µ
y desviación estándar σ = 0, 6 minutos. Con base a esta muestra. ¿Existe alguna razón para creer, a
un nivel de 0,05, que el tiempo de armado promedio es mayor a 10 minutos? R: No existe evidencia
suficiente para rechazar la hipótesis de que el tiempo promedio es de 10 minutos.
18. Se afirma que una aspiradora gasta un promedio de 46 kilowatts-hora al año. Si una muestra aleatoria
de 12 hogares, que se incluye en un estudio planeado, indica que las aspiradoras gastan un promedio
de 42 kilowatts-hora al año con una desviación estándar de 11.9 kilowatts-hora, ¿esto sugiere que las
aspiradoras gastan, en promedio, menos de 46 kilowatts-hora al año a un nivel de significancia de
0.05? Suponga que la población de kilowatts-hora es normal.
R: No es significativamente menor que 46.
19. Un fabricante de baterı́as para automóvil afirma que la duración de sus baterı́as se distribuye de forma
aproximadamente normal con una desviación estándar igual a 0,9 años. Si una muestra aleatoria de
10 de tales baterı́as tiene una desviación estándar de 1,2 años, ¿Considera que σ > 0,9 años? Utilice
un nivel de significancia de 0.05. R: No hay evidencia de que σ > 0, 9

4
Universidad Técnica Federico Santa Marı́a
Departamento de Matemática
Casa Central Prof. Ronny Vallejos

20. Suponga que tiene muestras aleatorias de igual tamaño n de dos distribuciones normales independien-
tes con varianzas conocidas σ2X y σ2Y , las cuales se emplean para comprobar el siguiente test
H0 : µX − µY = δ0
H1 : µX − µY = δ1 > δ0
Si se especifican los tamaños particulares de α y β de los errores tipo I y del tipo II, respectivamente.
Obtener una expresión para n.
(σ2 +σ2 )(z −zβ )2
R:n = X (δY1 −δ1−α0)
2 , donde z1−α y zβ satisfacen P(Z ≥ z1−α ) = α y P(Z < zβ ) = β con Z una variable
aleatoria con distribución normal estándar.
21. Para estudiar si el efecto del ruido sobre la habilidad de las personas al llevar a cabo una determinada
tarea, un investigador selecciona 32 personas que son capaces de realizar la misma tarea y de manera
práctica en el mismo tiempo. Del total de personas, 16 seleccionadas al azar realizarán esta tarea bajo
un nivel modesto de ruido de fondo. Las restantes 16 llevarán a cabo la misma tarea bajo un ruido de
nivel 2, el cual es más severo que el ruido de nivel 1. Los siguientes datos representan los tiempos
observados (minutos) en completar la tarea para cada una de las 16 personas de cada nivel.
Nivel 1 14 12 15 15 11 16 17 12 14 13 18 13 18 15 16 11
Nivel 2 20 22 18 18 19 15 18 15 22 18 19 15 21 22 18 16
Asumiendo que estos datos constituyen muestras aleatorias de dos distribuciones normales e inde-
pendientes con varianzas iguales pero desconocidas. ¿Existe alguna razón para creer que el tiempo
promedio para el nivel 2 es mayor por más de dos minutos que para el nivel 1 con α = 0, 01?
R: La diferencia entre las medias de niveles 1 y 2 es mayor a dos minutos.
22. Se organizará una votación entre los residentes de una ciudad y el condado para determinar si se aprue-
ba una propuesta para la construcción de una planta quı́mica. El condado considera que la propuesta
será aprobada si hay una gran proporción de votantes que este a favor de que se construya. Se realiza
una encuesta para determinar si hay una diferencia significativa en la proporción de votantes de la
ciudad y del condado que favorecen la propuesta. Si 120 de 200 votantes de la ciudad favorecen la
propuesta y 240 de 500 residentes del condado también lo hacen, ¿Estarı́a usted de acuerdo en que
la proporción de votantes de la ciudad que favorecen la propuesta es mayor que la proporción de vo-
tantes del condado? Utilice un nivel de significancia de α = 0,05. R: Se está de acuerdo en que la
proporción de votantes de la ciudad a favor de la propuesta es mayor que la proporción del condado.
23. Una refinerı́a está investigando dos procesos para producir gasolina a partir del petróleo crudo. Se
supone que el rendimiento, en porcentaje, de ambos procesos de distribuye normal. Una experiencia
llevada a cabo en una planta mostró los siguientes resultados:

Proceso 1 2 3 4 5 6 7 8 9 10
I 25,9 26,6 25,7 24,8 26,1 26,5 27,4 25,7 27,1 24,2
II 23,3 26,1 23,8 22,9 24,4 24,7 25,5 23,1 26,7
a. Defina las variables asociadas al problema y determine intervalos de confianza del 98 % para los
parámetros de las variables definidas.
R: IC98 % (µX ) = [25, 12; 26, 88] , IC98 % (µY ) = [23, 18; 25, 82], IC98 % (σ2X ) = [0, 40; 4, 148] y
IC98 % (σ2Y ) = [0, 742; 9, 056]
b. Si análisis financieros han establecido que el rendimiento medio deben ser superior a un 24 %,
para que un proceso sea rentable. ¿Son los procesos planteados rentables para la refinerı́a con un
5 % de significancia?. R: El proceso I es rentable y el proceso II no lo es.
c. ¿Es posible suponer que el rendimiento medio disminuye del proceso II al proceso I, con un 5 %
de significancia?. R: Si se puede suponer.

También podría gustarte