Está en la página 1de 8

Estadı́stica II

Ejercicios Tema 2

1. Una empresa farmacéutica está preocupada por controlar el nivel de impurezas en uno de sus
productos; su objetivo es que la concentración de las impurezas no supere el 3 %. Se sabe que para
un lote del producto la concentración de las impurezas sigue una distribución normal con desviación
tı́pica de 0,4 %. Se ha seleccionado una muestra aleatoria de un lote del tamaño 64, y se ha obtenido
que la concentración promedio de las impurezas en la muestra era de 3,07 %.
a) Contraste a un nivel del 5 % que la media de impurezas en la población es igual al 3 %, frente
a la alternativa de que sea mayor del 3 %.
b) Encuentre el menor nivel de significación para el que se pueda rechazar la hipótesis nula.
c) Supongamos que la hipótesis alternativa fuese bilateral en vez de unilateral. Indique, sin llevar
a cabo nuevos cálculos, si el p-valor del contraste serı́a superior o inferior al obtenido en 1b.
Dibuje un gráfico que ilustre sus argumentos.
d ) En el contexto de este problema, explique por qué una hipótesis alternativa unilateral puede
ser más apropiada que una hipótesis bilateral.
2. Un profesor de Estadı́stica está interesado en contrastar la capacidad de los estudiantes para deter-
minar la dificultad de un examen una vez que lo han completado. Un número elevado de estudiantes
han realizado un examen, con una nota promedio de 78,5. Se pide a una muestra aleatoria de ocho
estudiantes que proporcionen su predicción para esta nota media, obteniendo los valores siguientes:

72 83 78 65 69 77 81 71

Suponemos que la distribución de estas predicciones es normal.


a) Contraste la hipótesis nula de que la media de las predicciones en la población serı́a igual a
78,5. Utilice una alternativa bilateral y un nivel de significación del 10 %.
b) Si se hubieran obtenido los mismos valores (media y desviación tı́pica) en una muestra aleatoria
de dieciséis estudiantes, ¿serı́a la conclusión del contraste diferente de la obtenida en 2a?
c) Si llevar a cabo ningún nuevo cálculo y sobre la base de la respuesta a 2a, decida si un intervalo
de confianza al 90 % para la media de la población incluirı́a el valor 78,5 o no. ¿Y en el caso
de un intervalo de confianza para la media al 95 %?
3. El alcalde de una ciudad cree que en una zona especialmente deprimida al menos el 20 % de todos
los varones entre 18 y 65 años de edad están en paro. Sin embargo, una encuesta reciente sobre una
muestra aleatoria de 120 hombres de esta población incluyó a veinte desempleados.
a) Contraste la creencia del alcalde a un nivel de significación del 5 % frente a la evidencia de la
muestra.
b) Calcule la potencia de dicho contraste.
c) Construya una gráfica de la curva obtenida en 3b usando Excel.
d ) A partir del gráfico obtenido en 3c, ¿para qué valores de p es la potencia del contraste mayor
o igual que 0,8 (aproximadamente)? Para estos valores de p, ¿cuál es una cota superior para
la probabilidad de un error de Tipo II?
e) ¿Cuál serı́a una cota superior para la potencia cuando p ≥ 0,2?
4. Una posible manera de evaluar la eficiencia de un profesor consiste en examinar las puntuaciones
obtenidas por sus alumnos en el examen final. El valor medio de estas notas es por supuesto rele-
vante, pero también lo es su varianza: algunos profesores pueden trabajar muy bien con estudiantes
brillantes, pero pueden obtener peores resultados con estudiantes menos brillantes o menos motiva-
dos. Para aplicar este procedimiento, el coordinador de la asignatura prepara un examen estándar
para todos los grupos de la misma. Este experimento se ha llevado a cabo durante varios años en

1
Estadı́stica II

una cierta asignatura, y la varianza observada ha estado habitualmente próxima a 300. Un nuevo
profesor imparte un grupo con treinta estudiantes, y en el examen final estos estudiantes han ob-
tenido calificaciones con una cuasi varianza muestral de 480. Supondremos que las notas de estos
estudiantes son una muestra aleatoria simple de una población normal.
a) Si suponemos que los resultados obtenidos para este grupo corresponden a la misma población
que los resultados de años anteriores, para un nivel de significación del 5 % contraste la hipótesis
nula de que la varianza de la población de todas las calificaciones es 300, frente a una alternativa
bilateral.
b) Basándose en la respuesta a 4a, indique si un intervalo de confianza al 95 % para la varianza
de la población contendrı́a el valor 300.
c) Calcule la potencia del contraste.
d ) Dibuje la función de potencia para 4c en Excel.
e) A partir de la gráfica en 4d , ¿cuál es la probabilidad de un error de Tipo II para σ 2 = 500
(aproximadamente)?
5. Indique cuales de las siguientes afirmaciones son verdaderas o falsas:
a) El nivel de significación de un test es la probabilidad de que la hipótesis nula sea falsa.
b) Un error de Tipo I se produce cuando una hipótesis nula verdadera es rechazada.
c) Una hipótesis nula se rechaza al nivel de 0,025, pero se acepta al nivel 0,01. Esto quiere decir
que el p-valor del contraste está entre 0,01 y 0,025.
d ) La potencia de un contraste es la probabilidad de aceptar la hipótesis nula cuando es verdadera.
e) Si se rechaza una hipótesis nula frente a su alternativa al nivel del 5 %, con los mismos datos
se deberı́a rechazar también frente a esa alternativa al nivel del 1 %.
f ) Si se rechaza una hipótesis nula frente a su alternativa al nivel del 1 %, con los mismos datos
se deberı́a rechazar también frente a esa alternativa al nivel del 5 %.
g) El p-valor de un contraste es la probabilidad de que la hipótesis nula sea verdadera.
6. Una compañı́a de seguros paga a sus agentes mediante comisiones. La compañı́a afirma que en su
primer año los agentes obtienen unas comisiones de 40000 euros en promedio, y que la desviación
tı́pica de la población es menor o igual a 6000 euros. Para una muestra aleatoria simple de nueve
agentes se han recogido los valores siguientes, correspondientes a las comisiones obtenidas en su
primer año,
!9 !9
xi = 333 y (xi − x̄)2 = 312,
i=1 i=1

donde xi está medida en miles de euros y la distribución de la población se supone normal.


a) Contraste a un nivel del 5 % la hipótesis nula de que la media de la población es al menos de
40000 euros (utilice el p-valor).
b) Contraste a un nivel del 10 % la hipótesis nula de que la desviación tı́pica de la población es
como máximo de 6000 euros (utilice el p-valor).
7. Un fabricante afirma que un aerogenerador en una localización concreta puede generar en promedio
al menos 800 kWh de energı́a por dı́a. Se supone que la generación de energı́a diaria del aeroge-
nerador sigue una distribución normal con desviación tı́pica igual a 120 kWh. Se recogen datos de
una muestra aleatoria de 100 dı́as para contrastar esta afirmación frente a la alternativa de que la
media es inferior a 800 kW. Se acepta la afirmación si la media muestral es 776 kWh o más, y se
rechaza en otro caso.
a) ¿Cuál es la probabilidad α de un error de Tipo I aplicando la regla de decisión anterior, si la
media de la población es realmente igual a 800 kWh por dı́a?
b) ¿Cuál es la probabilidad β de un error de Tipo II aplicando esta regla de decisión, si la media
de la población es realmente de 740 kWh por dı́a?
c) Supongamos que se aplica la misma regla de decisión, pero a una muestra de 200 dı́as en lugar
de 100 dı́as.

2
Estadı́stica II

1) ¿Serı́a el nuevo valor de α mayor, menor o igual que el obtenido en 7a?


2) ¿Serı́a el valor de β mayor, menor o igual que el obtenido en 7b?

Supongamos ahora que se trabaja con una muestra de 100 observaciones, pero la regla de decisión
se modifica para aceptar la afirmación siempre que la media de la muestra sea al menos igual a 765
kWh.
d ) Para esta nueva regla de decisión:
1) ¿Serı́a el valor de α mayor, menor o igual que el obtenido en 7a?
2) ¿Serı́a el valor de β mayor, menor o igual que el obtenido en 7b?
8. Queremos contrastar la hipótesis nula de que una proporción en una población es igual a 0,5 frente
a una alternativa bilateral. Una complicación en estos casos es que para un nivel de significación
dado, cuanto mayor es el número de observaciones en la muestra, más probable es que se rechace la
hipótesis nula. ¿Por qué es esto cierto, y en qué sentido puede plantear esta situación un problema
para un profesional que quiera aplicar técnicas de contraste de hipótesis en estos casos?

9. Consideremos la población de todos los residentes en Getafe. Estamos interesados en estudiar el


gasto semanal de estos residentes en pan, cantidad que suponemos sigue una distribución normal.
Para una muestra aleatoria simple de diez residentes se obtuvieron los siguientes valores de gasto
(en euros):
4,6 4,2 5,1 3,8 4,4 4,5 3,8 3,1 5,0 4,0
que podemos resumir en las cantidades siguientes:
n
! n
!
xi = 42,5 y x2i = 183,91.
i=1 i=1

a) Utilice un intervalo de confianza para contrastar la hipótesis nula de que la varianza de la


población σ 2 es igual a 2, frente a la alternativa bilateral, a un nivel de significación del 5 %.
b) Estudiamos ahora otro parámetro de la misma población, la proporción de residentes en Getafe
que gastan una cantidad igual o menor a 4 euros en pan a la semana, p. Deseamos llevar a
cabo un contraste unilateral, H0 : p ≥ 0,75, a un nivel del 5 %. Para ello, como necesitamos
una muestra mayor, recogemos información de otras 25 personas, que combinada con los datos
anteriores nos proporciona la muestra siguiente:

4,6 4,2 5,1 3,8 4,4 4,5 3,8 3,1 5,0 4,0
3,0 4,6 3,3 3,5 4,4 4,2 4,2 3,4 3,8 4,0
4,1 4,5 4,4 2,3 3,7 4,4 4,4 4,1 3,5 3,6
3,5 3,8 4,2 4,4 4,0

Estime la proporción de residentes en Getafe que no gastan más de 4 euros en pan a la semana,
y lleve a cabo el contraste indicado.

10. Los datos que se indican a continuación representan los tiempos de desplazamiento al trabajo (en
minutos) para una muestra aleatoria simple de 15 personas que trabajan en una planta industrial:

21,7 26,8 33,1 27,9 23,5 39,0 28,0 24,7 28,4 28,9 30,0 33,6 33,3 34,1 35,1

Suponemos que los tiempos de desplazamiento siguen una distribución normal. Hemos llevado a cabo
un contraste unilateral para una muestra en Excel a un nivel del 5 %, con el objeto de contrastar
nuestra creencia de que la media de los tiempos en la población no supera los 28 minutos
Describa formalmente el contraste a llevar a cabo. A partir de los resultados mostrados, ¿se re-
chazarı́a la hipótesis nula? ¿Cuál serı́a su conclusión? (Nota: Excel no incluye una función para
llevar a cabo un contraste sobre una muestra, por lo que hemos realizado un contraste para dos
muestras como muestras emparejadas, donde la primera muestra corresponde a los valores de los
que disponemos, y la segunda muestra está formada por n repeticiones de µ0 ).

3
Estadı́stica II

11. A continuación se muestra una salida de Excel, correspondiente a los datos del problema 9b. Inter-
prete sus contenidos, e indique como explicarı́a a un compañero suyo la manera de llevar a cabo el
contraste del problema 9b en Excel. Sugerencia: seleccione en Excel la opción correspondiente a un
contraste para muestras emparejadas.

12. Deseamos llevar a cabo el contraste de hipótesis siguiente: H0 : µ = −10 vs. H1 : µ ∕= −10. Se ha
obtenido una muestra aleatoria simple con 700 observaciones, y un valor (estandarizado) para el

4
Estadı́stica II

estadı́stico del contraste igual a −1,96. El p-valor asociado a este contraste es:

(a) 0,025 (b) 0,05 (c) 1,96 (d) Ninguno de los anteriores.

13. Se quiere verificar si un dado está equilibrado. Para ello, se decide llevar a cabo el siguiente expe-
rimento: se tira el dado tres veces y se concluye que el dado está cargado si la suma de las tres
tiradas es menor que 5.
a) Defina las hipótesis nula y alternativa para este contraste.
b) Defina la región crı́tica del contraste en función de los resultados de las tres tiradas.
c) Determine el nivel de significación del contraste.
d ) De una expresión para la potencia de este contraste en función de las probabilidades de cada
uno de los valores (pi , i = 1, . . . , 6, donde pi = P (X = i) con X = “el resultado de una
tirada”).
e) Determine la probabilidad de un error de Tipo II si p1 = 1/2 y todas las demás probabilidades
fueran iguales a 1/10.
14. Se ha observado que un cierto procedimiento de respuesta automática desarrollado para actuar
cuando se detectan problemas de calidad (emergencias) en una linea de producción da lugar a res-
puestas inadecuadas en ciertos casos. Se desea determinar si el procedimiento ha de ser modificado,
ya que en general ha funcionado adecuadamente. Se ha seleccionado una medida de calidad para
utilizar como referencia en esta decisión. Se supone que la medida sigue una distribución normal
con media igual a 15 y varianza igual a 1 (en ausencia de emergencias). Esta medida de calidad se
ha observado en n = 25 emergencias, obteniendo un valor promedio muestral de 15,4. Responda a
las preguntas siguientes:
a) A un nivel α = 0,05, ¿se dispone de evidencia suficiente para concluir que el procedimiento de
respuesta proporciona bajo emergencias un valor promedio de la medida de referencia mayor
que su valor observado en ausencia de emergencias?
b) La cuasi desviación tı́pica muestral para las 25 observaciones fue 1,2. ¿Implica este valor
que la varianza de la población para la medida de referencia ha aumentado en presencia de
emergencia, comparada con su valor en ausencia de emergencias? Lleve a cabo este contraste
para un nivel de confianza del 10 %.
c) ¿Obtendrı́a las mismas conclusiones si los contrastes anteriores fueran llevados a cabo a un
nivel del 1 %?
15. Como parte de una encuesta sobre la duración del empleo en un cierto sector económico, se ha
recogido información de una muestra de 86 empleados (una vez que abandonaron el sector). Estos
datos están disponibles en el fichero “datos ej2.xlsx”, medidos en años y meses de duración de los
empleos.
Utilice Excel para responder a las preguntas siguientes:
a) ¿Es razonable suponer que estos datos siguen una distribución normal? ¿Por qué?
b) ¿Proporciona la información en la muestra suficiente evidencia (a un nivel del 5 %) para re-
chazar la suposición habitual de que la media del tiempo que se permanece empleado en este
sector es al menos de cinco años y medio?
16. Para mejorar las habilidades de sus vendedores y las ventas de la empresa, una compañı́a está
considerando la posibilidad de ofrecerles cursos de formación en “Técnicas de Venta”. Como esta
formación es cara, se ha seleccionado un grupo de nueve vendedores al azar para participar en una
versión de prueba del programa de formación. Una vez completado el curso, y empleando las técnicas
aprendidas en el curso, los nueve empleados consiguieron una media de 115 unidades vendidas en
un cierto periodo de tiempo.
El objetivo de la empresa es que sus vendedores realicen unas ventas en promedio superiores a 100
unidades en ese periodo de tiempo. Suponemos que la variable de interés sigue una distribución
normal con una desviación tı́pica de 20 unidades.
a) A un nivel de significación del 5 %, contraste la eficacia del curso definiendo la región crı́tica
del correspondiente contraste de hipótesis.

5
Estadı́stica II

b) Obtenga el p-valor del contraste y haga una recomendación en relación con la implantación
del curso, en función del nivel de significación deseado.
c) Supongamos que µ = 120 tras el curso y el nivel de significación es del 5 %. Determine la
probabilidad de un error de Tipo II para este contraste.
d ) Supongamos que la empresa desease que la probabilidad de un error de Tipo II para este
contraste fuese inferior al 1 %, si µ = 120 y el nivel de significación permanece en el 5 %.
Encuentre el menor valor de n para el que se cumpla esta condición.

Exámenes de años anteriores


17. (Enero 2020) Una empresa de transporte de paquetes desea estudiar los datos relativos a sus entregas
mensuales. Para ello dispone de una muestra del tamaño de las entregas mensuales X (en miles de
unidades) para los últimos diez meses, cuyos valores cumplen que
10
! 10
!
xi = 365,2, x2i = 13386,02.
i=1 i=1

Supondremos que las entregas mensuales siguen una distribución normal.

a) Calcula e interpreta un intervalo de confianza al 99 % para la media de la población. Indica


tus hipótesis, el estadı́stico a emplear (la cantidad pivotal) y su distribución, ası́ como el valor
del intervalo calculado.
b) La empresa ha venido asumiendo hasta ahora que la proporción de entregas mensuales mayo-
res de 36 mil unidades no superaba el 40 %. Tras tomar una muestra aleatoria simple de 50
observaciones de números de entregas mensuales, se ha observado que 23 de estas observacio-
nes corresponden a valores superiores a 36 mil entregas. A la vista de esta nueva evidencia,
contrasta si la empresa debiera modificar su hipótesis (proporción no superior al 40 %), em-
pleando un nivel de significación del 5 %. Define la variable a estudiar, las hipótesis nula y
alternativa del contraste, tus supuestos sobre los datos, indica el estadı́stico del contraste y su
distribución, calcula el p-valor para este contraste e indica tus conclusiones.
c) Determina la potencia del contraste anterior si el valor correcto de la proporción de entregas
mensuales que superan las 36 mil unidades fuese igual al 50 %.

18. (Junio 2019) Una empresa verifica regularmente que el peso de las unidades elaboradas de uno
de sus productos no sea inferior a 240 gramos. En caso de detectar una desviación significativa la
empresa deberá reajustar sus procesos de producción, con el coste correspondiente.
Suponemos que este peso sigue una distribución normal, con una desviación tı́pica de 20 gramos.

a) Se ha tomado una muestra de n = 36 unidades del producto, obteniendo un peso promedio


de x̄ = 234 gramos. Realiza un contraste de hipótesis para determinar si la empresa debe
reajustar sus procesos. Calcula el p-valor del contraste e indica tu conclusión.
b) Indica si las afirmaciones siguientes son verdaderas o falsas, razonando tu respuesta:
1) Si aumenta el valor de la desviación tı́pica de la población manteniendo los demás valores
constantes, el p-valor del contraste anterior aumentará.
2) Si para el contraste anterior aumenta el tamaño muestral pero se mantienen todos los
valores restantes, incluyendo el nivel de significación α, el tamaño de la región de rechazo
definida en términos del valor del estadı́stico del contraste Z, disminuirá.

Se quiere aplicar la siguiente regla de decisión: seleccionar una muestra de tamaño n de este producto
y rechazar la hipótesis nula si el promedio de los pesos en la muestra es menor de 230 gramos.

c) Supongamos que el valor correcto del peso promedio es de 220 gramos. Si se emplean muestras
de tamaño n = 9, ¿cuál es la probabilidad de un error de Tipo II para esta regla de decisión?

19. (Enero 2019) En la fabricación de un producto se hacen controles diarios para garantizar su calidad.
El sistema de control consiste en seleccionar una muestra aleatoria de la producción diaria, y estudiar
el porcentaje de piezas cuyo nivel de defectos supera un cierto umbral.

6
Estadı́stica II

a) Se ha analizado una muestra de 50 piezas correspondientes a la producción del último dı́a,


siendo el resultado del análisis que 7 piezas superaban el valor umbral de defectos. Construya
un intervalo de confianza al 95 % para el porcentaje de piezas defectuosas en la producción de
ese dı́a.
b) La empresa ha decidido que descartará la producción de un dı́a determinado si el porcentaje
de piezas defectuosas ese dı́a supera el 8 %. Utilizando los datos de la muestra del apartado an-
terior, realice el contraste oportuno (usando α = 0,05) para saber si la empresa debe descartar
la producción de ese dı́a.
c) Para el contraste descrito en el apartado 19b, si el porcentaje real de defectos en la producción
de ese dı́a fuese del 15 %, ¿cuál serı́a la potencia del contraste?
d ) Discuta, justificando la respuesta, la veracidad de las siguientes afirmaciones:
1) En un contraste bilateral cuyo resultado fuese aceptar H0 , podrı́amos estar cometiendo
un error de tipo I.
2) Cuanto mayor es el nivel de confianza 1 − α, mayor es la probabilidad de un error de tipo
II, β.
3) Si en un contraste bilateral para la proporción obtenemos un estadı́stico de contraste
z = 1,82 y no rechazamos H0 , siempre se cumple que P (Z > 1,82) > α, donde Z ∼ N (0, 1).

20. (Junio 2018) Un Ayuntamiento está interesado en comprobar si es cierto que la comida que anual-
mente se desaprovecha en el sector de restauración de su ciudad no supera el millar de kilos por
restaurante. Ha contratado a una consultora para que realice un seguimiento a una muestra aleatoria
simple de 10 restaurantes, obteniendo un promedio de 1,15 miles de kilos de comida desaprovechada
anualmente, con una cuasi-desviación tı́pica de 150 kilos. Suponga que los kilos de comida desapro-
vechada siguen una distribución normal.

a) Ayude al Ayuntamiento a contrastar la afirmación sobre los restaurantes con un nivel de


significación del 5 %, construyendo la región de rechazo del mismo e indicando su conclusión.
b) Calcule el p-valor del contraste y comente el resultado.
c) Calcule la potencia del contraste cuando la cantidad de comida desaprovechada realmente es
de 1,1 miles de kilos.
d ) Indique si las siguientes afirmaciones son verdaderas o falsas; justifique solo las afirmaciones
falsas:
Para un valor de la cantidad real de comida desaprovechada dado, y manteniendo todo lo
demás constante, si aumenta el número de restaurantes de la muestra la potencia mejora.
Si el contraste se realiza al 1 % de significación, en lugar de hacerlo para el 5 %, el p-valor
resultante cambia.
La masa de probabilidad de la región de rechazo o crı́tica es 1 − α.

21. (Enero 2017) El Barómetro del CIS (Centro de Investigaciones Sociológicas) en su pregunta 4 recoge
información sobre la percepción de la situación polı́tica en España. En el barómetro de septiembre
de 2017 se han obtenido los siguientes resultados:

Pregunta 4:
Y refiriéndonos ahora a la situación polı́tica general en España, ¿cómo la calificarı́a usted?

Sept 2017
Muy buena 5
Buena 66
Regular 576
Mala 893
Muy mala 865
N.S. 75
N.C. 10
(Total) 2490

En base a la tabla anterior responda a los siguientes apartados:

7
Estadı́stica II

a) Obtenga un intervalo de confianza al 90 % para la proporción de españoles que considera la


situación polı́tica en España mala o muy mala en 2017.
b) El Gobierno afirma que la imagen que los españoles tienen de la situación polı́tica no ha em-
peorado en los últimos años. Más concretamente, considere la afirmación de que la proporción
de españoles que valoran la situación polı́tica en 2017 como mala o muy mala no es mayor del
68 % (valor que se obtuvo en 2016). Contraste si esta afirmación es cierta utilizando el p-valor
para alcanzar una conclusión.
c) (1 punto) Calcule la potencia del contraste anterior si la verdadera proporción de españoles
que valoran la situación polı́tica como mala o muy mala fuera de un 70 %, utilizando un nivel
de significación del 5 %.

También podría gustarte