Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ingeniería Química
Problemas de los temas 10 y 11
Problema 6 Se están investigando los diámetros de las barras de acero fabricadas por
dos diferentes máquinas de extrudado. Se seleccionan dos muestras aleatorias de tamaños
1 = 12 y 2 = 18, con medias y varianzas muestrales:
1 = 875 12 = 029 2 = 863 22 = 034
Obtener lo siguiente:
a) Un intervalo bilateral de confianza del 90% de 21 22 .
b) Un intervalo bilateral de confianza del 95% de 21 22 y comparar con a).
c) Cotas superior e inferior de confianza del 90% de 21 22 .
d) Un intervalo de comparación de medias con confianza del 95%. Interpretar el resultado.
e) Si se desea obtener una confianza del 95% de que el error a la hora de estimar la
diferencia de diámetros medios entre las dos máquinas sea menor que 03, ¿cuántas barras
procedentes de cada máquina deben medirse?
Problema 9 Se están empleando dos tipos diferentes de máquinas de moldeo por in-
yección para formar botellas plásticas. Se seleccionan dos muestras aleatorias, cada una
de tamaño 500, se encuentran 21 botellas defectuosas en la muestra proveniente de la
máquina 1, y 32 defectuosas en la que proviene de la máquina 2.
a) ¿Es razonable llegar a la conclusión con una confianza del 95% de que ambas máquinas
producen la misma fracción de botellas defectuosas?
b) Obtener el tamaño muestral necesario en cada muestra para que el error máximo
cometido por el I.C. para comparar las proporciones sea menor que 001 con una confianza
del 95%.
c) Obtener cotas de confianza superiores al 99% de confianza para las proporciones de
defectos de ambas máquinas.
Soluciones
√
1. a) ̄ Ã (5 01 8) b) 01586 c) 385
2. a) 1 − 2 Ã (−5 0 4726) b) 0017 c) 42 d) La distribución es aproximadamente
normal para muestras grandes
µ q ¶
3. a) Por el TCL, se tiene aproximadamente ̂ Ã (1−)
b) 05286 c) 2215. (Nota:
Se ha usado la corrección por continuidad)
4. a) 1014 ± 1096 b) 1014 − 2326 √2520 = 1014 − 13003 c) 97
5. a) (042 423) b) −15 ± 1318 c) −15 + 109 d) −15 − 109
e) Utilizando tanteo, el valor de de los apartados anteriores y las tablas de la distribución
se tiene que 1 = 2 = 31
f) Utilizando la fórmula para 1 y 2 grandes se tiene que 1 = 2 = 95.
6. a) (0353 2295) b) (0296) 2796) c) (0 1785) y (0429 ∞) d) 012 ± 0431
e)Utilizando tanteo, el valor de de los apartados anteriores y las tablas de la distribución
se tiene que 1 = 2 = 31.
7. a) IC: (0097 0690). El intervalo no contiene el valor 1 y las varianzas pueden considerarse
distintas con la confianza utilizada. Al 90% de confianza el intervalo estaría contenido en
el anterior y la conclusión sería la misma.
b) IC: (−001116 000116). El intervalo contiene el valor 0 y las medias pueden consider-
arse iguales con la confianza utilizada. Los grados de libertad obtenidos para el estadístico
son = 3206. Como en las tablas de la asignatura se pasa de = 30 a = 40, se ha usado
300025 = 2042 para garantizar la confianza. El valor exacto dado por STATGRAPHICS
para el obtenido es 2037, que llevaría a las mismas conclusiones.
c) 1 = 2 ≥ 173.
8. Usando 0025 = 1645 se tiene a) 3637 b) 6766 c) 1762
9. a) Sí, dado que el intervalo de confianza para 1 − 2 es [−00497 00057] contiene al 0.
b) 1 = 2 = 3842 (1 = 2 = 19208 si no utilizamos información sobre y acotamos
(1 − ) por 025).
c) 00629 y 00895.
10. a) (1202 1538) b) Usando 0025 = 1645 se tiene = 397.
Estadística 1 Grados impartidos en Paseo del Cauce
Problemas del tema 12
Problema 2 Un jugador piensa que un dado está sesgado a favor del 6. Para contrastar
su creencia lanza el dado 5 veces.
a) Establecer las hipótesis nula y alternativa.
b) Sea el número de veces que aparece el 6. Considerar la región crítica = { ≥ 2}.
Calcular el nivel y la potencia en = 15.
Problema 3 Una máquina produce varillas de acero cuya longitud tiene distribución
normal. Se quiere estudiar la longitud media de las varillas sabiendo que la desviación
típica es = 02.
a) Contrastar 0 : = 10 contra 1 : 10 a nivel = 005 en base a una muestra de
tamaño 10 con las siguientes medidas
982 973 985 991 986 972 987 992 963 979.
b) ¿Cuál es el tamaño de la muestra a partir del cual ≤ 01 si la verdadera media de la
población es de 98?
c) Repetir el apartado b) con el contraste 0 : = 10 contra 1 : 6= 10.
Problema 4 Dada la m.a.s. 139 151 1202 1325 1601 1503 1405 146 1222 de una
población con distribución normal de media y desviación típica conocida = 162. Con-
trastar las siguientes hipótesis a nivel = 005:
a) 0 : = 13 b) 0 : = 15
1 : 6= 13 1 : 6= 15
Observar que en ambos casos no es posible rechazar la hipótesis nula.
Problema 5 Se toma una muestra de tamaño 16 de una población ( 2 ) para con-
trastar 0 : = 52 contra 1 : 52. Sea 2 = 016 conocido y = 54. Obtener el
nivel más pequeño al que es posible rechazar la hipótesis nula.
Soluciones
1) a) Rechazar si el “número total de llamadas” es estrictamente mayor que 5. Con estos
datos se rechazaría la hipótesis nula. b) 0631.
2) a) 0 : = 16 y 1 : 16. b) “Nivel" = 01962 y “Potencia"=026272.
3) a) Región de rechazo = { 9895} y se rechaza 0 puesto que ̄ = 981. b) ≥ 9
c) ≥ 11.
4) Las regiones de rechazo son 1 = {| − 13| 10584} y 2 = {| − 15| 10584}.
Con = 1402 no se rechaza ninguna de las dos hipótesis nulas.
5) 00228.
Estadística 1o Grados de Ingeniería Mecánica e
Ingeniería de Organización Industrial
Problemas del tema 13
(en las tablas anteriores las desviaciones típicas que aparecen están corregidas y podemos
suponer que la hipótesis de normalidad es razonable donde la necesitemos).
a) A partir de la muestra del estudio, obtén una cota inferior de garantía 95% para el
consumo medio de gas en esa casa antes de instalar el aislamiento.
b) Usando la información que necesites de las tablas anteriores, ¿Podemos suponer que
el consumo medio semanal de gas se reduce significativamente con el aislamiento? Da
una acotación razonable para el -valor del contraste planteado.
c) ¿Con qué probabilidad detectaríamos una reducción en el consumo semanal medio de
gas en 13 ó más mediante el contraste del apartado b) trabajando a nivel = 005?
d) ¿Permiten los datos afirmar a nivel = 005 qué el aislante sirve para reducir signi-
ficativamente el consumo semanal medio en más de 13 ?
e) Supongamos, ahora, que la desviación típica para el consumo de gas antes de la insta-
lación del aislamiento es conocida e igual a = 113 . Para analizar si el consumo
medio puede suponerse igual a 53 (0 : = 5) realizamos un test consistente en
rechazar 0 si la media muestral ̄ no está dentro del intervalo [45 525]. Determina
la probabilidad de error tipo I y la probabilidad de error II en la alternativa = 553
para esta regla de decisión basada en muestras de = 26 observaciones.
1
b) En relación con el mercado de viviendas unifamiliares en la ZONA del Alfoz de la
capital, en el estudio aparecen 26 operaciones realizadas en el primer trimestre de 2005
y otras 26 en el mismo trimestre de 2006. Los resultados del estudio para la variable
VALOR en unidades logarítmicas se resumen en la siguiente tabla:
1 2 4 26 Media Desv. Típic.
2005 5.65 5.66 5.83 5.49 1 = 566 1 = 032
2006 5.90 5.99 5.69 5.71 2 = 584 2 = 028
Diferencias 0.25 0.33 -0.14 0.22 = 018 = 037
Suponiendo normalidad y que las varianzas de las dos poblaciones pueden suponerse idénti-
cas:
b) ¿Las observaciones que se tomaron en las muestras e eran suficientes para poder
detectar al menos el 90% de las veces una reducción en el porcentaje de impurezas
superior al 5% en el contraste realizado en a)? ¿Cuántas observaciones serían necesarias
para garantizar esa potencia?
El investigador tiene serias dudas respecto al hecho de que las varianzas puedan suponerse
iguales:
2
d) Realiza un test para ver si las varianzas pueden suponerse idénticas a nivel = 005.
e) ¿Podemos afirmar que se ha producido una reducción en las variabilidad de los por-
centajes de impurezas al instalar el filtro trabajando a nivel = 001? Proporciona una
cota inferior al 95% para el número de veces que es mayor dicha variabilidad cuando
no se usa el filtro respecto a cuando sí se usa.
f) A la vista del resultado del apartado d), ¿se puede plantear algún contraste alternativo
aproximado para ver si el filtro es efectivo? Da las conclusiones de dicho contraste.
b) ¿Podemos afirmar que esa diferencia entre diámetros medios al medir con los dos
tipos de calibres sea superior a 01trabajando a nivel 001? Obtén una acotación
razonable del -valor.
c) ¿El tamaño muestral considerado en este estudio fue suficiente para detectar una dife-
rencia en medias de 02 con una garantía del 90% en el contraste realizado en el
apartado a)? ¿Qué tamaño muestral necesitamos?
d) Obtén intervalos de confianza de garantía 95% para las desviaciones típicas pobla-
cionales de las mediciones obtenidas con el calibre analógico y con el digital. ¿Po-
dríamos decidir a partir de estos intervalos de confianza qué tipo de calibre es mejor?
¿Una posible diferencia entre desviaciones típicas poblacionales podría afectar a la
validez de los procedimientos estadísticos aplicados en los apartados a), b) y c)?
e) Contamos con dos fábricas A y B dedicadas a producir este tipo de tuerca. Se considera
que una tuerca es defectuosa si su diámetro no está entre 22 y 23 . El fabricante A
nos asegura que a lo sumo sólo un 2% de las tuercas que comercializa son defectuosas.
Usando un calibre digital fiable vemos que en un lote de 5000 tuercas de dicho fabricante
hay 113 defectuosas. A partir de esta muestra, ¿podemos garantizar que la afirmación
del fabricante no es cierta a nivel = 001?
3
f) En un lote de 4000 tuercas (también aleatoriamente seleccionadas) del fabricante B en-
contramos 79 tuercas defectuosas. ¿Existen diferencias estadísticamente significativas
en la proporción de tuercas defectuosas a favor de algún fabricante? Da una acotación
razonable para el -valor del contraste realizado.
a) Plantear y contrastar las hipótesis apropiadas para = 005. Dar una acotación
razonable del -valor.
c) Si la sospecha hubiera sido que los precios en CT son al menos 025 superiores en
promedio, plantear y contrastar de nuevo las hipótesis apropiadas para = 005. Dar
una acotación razonable del -valor.
Como el precio de cada uno los artículos varía de unos establecimientos comerciales a otros,
se consideró para cada artículo el precio promedio observado en 10 establecimientos de cada
tipo elegidos aleatoriamente.
d) De los 10 precios observados en CT para el Artículo 17, la media fue de 724, con
una desviación típica (corregida) de 042, mientras que en GS la media fue de 698
con una desviación típica (corregida) de 035. Se puede afirmar estadísticamente que
el precio medio de dicho artículo es superior en CT. Dar una acotación razonable del
-valor.
e) Construir cotas superiores de confianza al 99% para el precio medio del Artículo 17 en
ambos tipos de establecimientos.
4
Problema 6 Un proceso de purificación para un producto químico implica pasar la solución
química a través de una resina que absorbe sus impurezas. Un ingeniero decide testar la
eficiencia de dos resinas A y B. Con este fin, se toma una muestra de la solución química,
que se divide en 40 submuestras. Finalmente, tras filtrar cada una de esas submuestras
usando alguno de los dos tipos de resina, se mide la concentración de impurezas en % . Los
resultados obtenidos se resumen en la siguiente tabla:
A B Dif
---- ---- ----
1 0.77 1.01 0.24 Media de A = 0.496
2 0.72 0.94 0.22 Desviación típica (corregida) de A = 0.234
3 0.69 0.55 -0.14 Media de B = 0.744
4 0.01 0.47 0.48 Desviación típica (corregida) de B = 0.253
5 0.39 0.92 0.53 Media de "Dif" = 0.248
... ... ... Desviación típica (corregida) de "Dif" = 0.280
19 0.69 0.67 -0.02
20 0.24 0.86 0.62
a) ¿Puede afirmarse a nivel = 001 que la resina A es mejor que la resina B para reducir
los niveles de impurezas medios en ese producto químico?
b) Se desea poder detectar con el test anterior una reducción en los niveles medios de
impurezas de 02% a favor de la resina A con una seguridad del 90%. ¿Fue el número
total de submuestras analizado suficiente? ¿Cuantas submuestras serían necesarias?
5
(vehículo A) y otro con las innovaciones (vehículo B). Así, cada usuario asigna puntuaciones
que permiten generar un índice de satisfacción para cada vehículo, A y B, cuyo valor varía
de 0 (nada satisfecho) a 10 (muy satisfecho) puntos. Se obtienen los siguientes resultados
siendo =“Índice satisfacción con vehículo A” e =“Índice satisfacción con vehículo B”:
Usuario = −
1 5 8 3
2 4 7 3
... ... ... ...
29 6 7 1
30 4 5 1
Media 4.9 6.8 1.9
Desv. típica (corr.) 1.6 1.5 2.3
a) Obtén una cota superior de garantía del 95% para el índice de satisfacción media del
vehículo con innovaciones. Plantea hipótesis 0 y 1 tales que esta cota permita definir
una región de rechazo de tal forma que el contraste asociado tenga nivel = 005.
b) ¿Se puede suponer que el índice de satisfacción medio aumenta significativamente in-
troduciendo las innovaciones en el vehículo? Plantea el contraste adecuado y da sus
conclusiones a nivel = 001.
c) Determina si fue suficiente el número de usuarios utilizado para que el test del apartado
b) pueda detectar una diferencia de 09 puntos con una probabilidad del 90%. En el caso
de que el número no sea suficiente, ¿cuántos usuarios en la muestra serían necesarios?
d) ¿Permiten los datos afirmar que introducir innovaciones en el vehículo aumenta signi-
ficativamente el índice de satisfacción medio en más de 15 puntos? Da una acotación
razonable para el -valor del contraste asociado.
e) Supongamos, ahora, que la desviación típica para el índice de satisfacción con el ve-
hículo B se conoce y es igual a 19 Para analizar si la satisfacción media con el vehículo
B se puede suponer igual a 7 puntos se realiza un test consistente en rechazar dicha
hipótesis si la media muestral no está dentro del intervalo [6 75]. Determina la
probabilidad de error tipo I y la probabilidad de error tipo II en el caso de que la
media verdadera sea 75 para esta regla de decisión basada en 30 observaciones.
6
Soluciones a los problemas del tema 13
Problema 1 Lo primero que conviene señalar a la luz del planteamiento que se hace en el
enunciado del problema, es que estamos ante un estudio estadístico de comparación de dos
poblaciones normales a partir de dos muestras independientes. Nótese que en el enunciado
del problema no se da ninguna información que permita pensar que la observación primera de
la muestra “Antes” esté relacionada con la observación primera de la muestra “Después” en
mayor medida que con cualquier otra observación de las de dicha muestra (son días distintos,
con temperaturas distintas, etc.).
Utilizaremos la notación 1 Ã (1 1 ) para el consumo “Antes” y 2 Ã (2 2 )
para el consumo “Después”.
a) Tenemos que obtener un IC al 95% para 1 con 1 desconocida:
√ √
≥ 1 − −1 · 1 = 475 − 1708 · 116 26 = 436
Usamos el estadístico:
1 − 2 − 1 475 − 347 − 1
= q = q = 09846
1 1 1 1
1 + 2 1025 26 + 26
7
Como 1 +2 −2005 = 1676, no se rechaza 0 (01 -valor 025) y no se puede afirmar
que el aislante reduzca en más de 13 el consumo de gas semanal.
e) Se nos pide evaluar las probabilidades de error y si realizamos el contraste de
hipótesis ½
0 : 1 = 5
1 : 1 6= 5
utilizando como región de aceptación 1 ∈ [45 525]
Problema 2 a) Para obtener una cota inferior de confianza para al 95% bajo hipótesis de
normalidad, aplicamos la fórmula correspondiente:
( − 1) 2 (31 − 1) · 50022 30 · 50022
2 ≥ = = = 17148735
2−1 231−1005 4377
es decir, ≥ 41411
b) Utilizaremos la notación 1 Ã (1 1 ) para la variable VALOR (en unidades log.)
de las operaciones realizadas en el primer trimestre de 2005 y 2 Ã (2 2 ) para el año
2006. Nos piden realizar una comparación de las medias de los dos años y la primera discusión
que surge es si el diseño muestral realizado es el correspondiente a muestras independientes o
apareadas. Del enunciado del primer párrafo del problema se desprende de manera obvia que
las muestras son independientes. Además, no se da ninguna información que permita pensar
que cada observación de la fila correspondiente al año 2005 tenga respecto a la observación
del año 2006 que está justo debajo de ella alguna vinculación especial diferente de la que
pudiera tener con cualquier otra observación de dicha fila. De este modo, la información
presentada sobre las diferencias no tiene ninguna utilidad para el problema.
Primero, probaremos que podemos suponer que las varianzas de las dos poblaciones son
iguales. Usando la distribución y las fórmulas habituales, obtenemos que [059 293] es
un IC para 21 22 con confianza del 95%. El IC contiene al 1 y podemos suponer 21 = 22 .
Nótese que esta manera de proceder es equivalente a la realización de una prueba de hipótesis
bilateral de comparación de varianzas.
Para estudiar si se ha producido un aumento significativo de los valores medios de los
inmuebles en unidades logarítmicas, tenemos que plantear el contraste unilateral de com-
paración de medias con varianzas iguales y desconocidas:
½
0 : 2 − 1 ≤ 0
1 : 2 − 1 0
8
El estadístico de contraste es:
− 1 584 − 566
= q2 = q = 213
11 + 12 030 261 1
+ 26
Como se nos dice que las varianzas son idénticas, usaremos el estadístico para comparación
de medias con varianzas desconocidas pero iguales. Así, calculamos el estimador combinado
de la varianza dado por
2
2 (12 − 1) + (12 − 1)2 11 · 10244 + 11 · 2081
Pooled = = = 6163
12 + 12 − 2 12 + 12 − 2
p
2
y el estimador de dado por Pooled = Pooled = 784. Por tanto,
− 19735 − 10421
= q = q = 291
1 1 1 1
Pooled 12
+ 12
784 12 + 12
9
Como = 291 12+12−2;001 = 251, se rechaza la hipótesis nula 0 y queda probada la
efectividad del dispositivo de filtrado.
b) Queremos tener una potencia del 90% para detectar la alternativa
− − 5
= ' = = 031
2 2Pooled 2 · 784
Usando la carta VI(h) vemos que necesitamos ∗ ' 100 para tener la potencia deseada (con
1 = 2 = = 12 tenemos ∗ = 2 − 1 = 23 y nos quedaríamos cortos). Por tanto, se
necesitan 1 = 2 = (∗ + 1)2 ' 50.
c) Debemos realizar ahora el contraste
½
0 : ≤ + 5
1 : + 5
Con este fin, usaremos
− −5 19735 − 10421 − 5
= q = q = 135
1 1 1 1
Pooled 12 + 12 784 12 + 12
Viendo que 22;01 = 132 y 22;005 = 172, llegamos a un -valor entre [005 01] (más próximo
a 01). Consecuentemente, no tenemos evidencia estadística para realizar esa afirmación a
nivel = 005.
d) Realizaremos un contraste de igualdad de varianzas:
½
0 : 2 = 2
1 : 2 6= 2
2
Usaremos el estadístico de contraste = 2 = 102442081 = 492. Rechazamos la
hipótesis nula si ∙ ¸
1
∈ 1111;2
1111;2
Como 1111;0025 = 347, se rechaza la hipótesis nula a nivel = 005 y, por tanto, las
varianzas no pueden suponerse idénticas a ese nivel.
e) Ahora planteamos el contraste de un lado:
½
0 : 2 ≤ 2
1 : 2 2
Como = 492 1111;001 = 446, se puede afirmar a nivel = 001 que se ha producido
una reducción en las variabilidades de los porcentajes de impurezas al instalar el filtro. La
cota inferior de confianza al 95% tiene la forma
2 2
1 1
2
≥ 2
= 492 · = 1746 (veces).
1111;005 282
f) Volvemos a realizar el contraste
½
0 : ≤
1 :
10
pero ahora (a la vista de los apartados d) y e)) suponemos varianzas desconocidas y distintas.
Usamos el estadístico
− 19735 − 10421
= q 2 2
= q = 291
10244 2081
12
+ 12 12
+ 12
1 +1
+ 2 +1
Como = 291 16;01 = 258, se rechaza también la hipótesis nula a nivel = 001 y queda
probada la efectividad del filtro.
Problema 4 Dada la estructura de los datos estamos ante claramente ante un problema de
datos pareados.
a) Para = Digital − Analog planteamos el contraste
½
0 : ≥ 0
1 : 0
Usamos el estadístico
−0234
= √ = √ = −321
0326 20
y vemos que −321 −20−1;001 = −254. Por tanto, se rechaza la hipótesis nula y queda
probada la afirmación del enunciado.
b) Ahora debemos realizar el test
½
0 : ≥ −01
1 : −01
con el estadístico de contraste
− (−01) −0234 + 01
= √ = √ = −183
0326 20
El -valor será (19 −183) = 0041 (con las tablas sólo se puede ver que está entre 0025
y 005). Por tanto, no queda probada esa afirmación a nivel = 001
c) Debemos estudiar la potencia del test del primer apartado (con = 001 y “unila-
teral"). Para entrar en las tablas usamos = 020326 = 062 y vemos que con = 20 la
probabilidad de error tipo II es ' 04. Para tener la potencia = 09 deseada se necesitan
aproximadamente = 40 pares de datos.
d) El intervalo de confianza de garantía 95% para la varianza del calibre analógico es
∙ ¸
(20 − 1)03982 (20 − 1)03982
= [0092 0338]
2190025 2190975
11
y para el calibre digital será
∙ ¸
(20 − 1)01672 (20 − 1)01672
= [0016 0059]
2190025 2190975
Tomando raices cuadradas en los extremos de estos intervalos tenemos los intervalos de
confianza [0303 0581] y [0127 0244] para las desviaciones típicas de los calibres analógico
y digital, respectivamente. Aunque estos intervalos no están solapados (o aunque el intervalo
para el cociente de varianzas no contenga el valor 1) no se invalida lo realizado en los
apartados a), b) y c). Nótese que estamos realizando un test “ por pares” donde no se exige
ninguna hipótesis de igualdad de varianzas.
No podemos decir qué calibre es el mejor sólo a partir de estos intervalos. Una menor
varianza, en principio, nos indicaría una mayor precisión del aparato de medida pero debemos
tener en cuenta si el calibre está bien “calibrado” o por el contrario está “sesgado”. Sin esa
información no está claro cuál es el mejor calibre.
e) Para ver si la afirmación es correcta debemos realizar el test
½
0 : ≤ 002
1 : 002
Usamos
b − 002 00226 − 002
=q = q = 131
002(1−002) 002(1−002)
5000 5000
No tenemos evidencia estadística para afirmar que lo comentado por el fabricante no pueda
ser cierto ya que 131 001 = 232.
f) Si y son las fracciones de defectuosas para las fabricas y , debemos realizar
ahora el test de comparación de proporciones
½
0 : =
1 : 6=
b − b
=q ¡ 1 ¢ = 0937
1
b(1 − b) 5000 + 4000
El -valor de dicho test será 2(1 − Φ(0937)) = 0349 y, por tanto, no detectamos diferencias
significativas a los niveles habituales para las fracciones de defectuosos entre las dos fábricas.
12
apareadas tienen la ventaja de permitir observar las diferencias con más potencia debido a la
reducción de la variabilidad proporcionada por el apareamiento de las observaciones. En este
caso, se ha planteado un diseño claramente de muestras apareadas. Se ha seleccionado una
muestra de 25 artículos y se han anotado para cada uno de ellos el precio en los dos tipos de
establecimientos. Cada par está formado por los dos precios observados para cada artículo
en CT y en GS. Lógicamente, al tratarse en cada par del mismo artículo, las diferencias de
precios se deberán básicamente a la distinta naturaleza de los establecimientos comerciales.
En el enunciado se nos dice que se asume la hipótesis de normalidad donde sea necesaria.
En el caso de muestras apareadas, sabemos que sería suficiente tener la normalidad para la
población de las diferencias = − , Ã ( ) ( = − ).
a) En este apartado se pide probar la hipótesis (1 ) de que los precios medios en CT son
más elevados que en GS. Planteamos por tanto un contraste unilateral de comparación de
medias para muestras apareadas bajo hipótesis de normalidad.
½
0 : = 0
1 : 0
La región crítica es = [0 −1; ], siendo el estadístico de contraste
0 = √ Ã −1
Operando, obtenemos
055
0 = √ = √ = 1833 17109 = 24;005
150 25
por lo que al nivel de significación = 0 05 rechazamos 0 y concluimos que los precios
son significativamente más altos en media en CT. Con nuestras tablas, podemos decir que
0025 -valor 005 (00396).
b) Se nos pide estudiar si el tamaño muestral utilizado para la prueba realizada en a)
permitiría detectar una diferencia medias = 06 Euros con una potencia = 09. Para
ello usamos las Curvas OC, concretamente la Carta , y observamos que se necesitarían
aproximadamente = 50 observaciones (pares). Con las = 25 observaciones utilizadas,
tendríamos una potencia de apenas = 063.
c) En este apartado se pide probar la hipótesis (1 ) de que los precios medios en CT son
al menos 025 Euros más elevados que en GS. Ahora el contraste de hipótesis pedido sería
½
0 : ≤ 025
1 : 025
La región crítica es de nuevo = [0 −1; ], siendo ahora el estadístico de contraste
− 025
0 = √ Ã −1
Operando, obtenemos
− 025 055 − 025
0 = √ = √ = 1 17109 = 24;005
150 25
13
por lo que al nivel de significación del = 005 no podemos rechazar 0 y concluimos que
no queda probada la existencia de la mencionada diferencia de 025 Euros a favor de CT.
Con nuestras tablas, podemos decir que 010 − 025 (01636).
d) En el enunciado nos dicen que, dado que el precio de cada uno de los artículos varía de
unos establecimientos comerciales a otros, los precios de los artículos se obtuvieron prome-
diando los precios observados en 10 establecimientos de cada tipo elegidos aleatoriamente.
Con esta información, se nos pide probar la sospecha (1 ) de que el precio medio del “Artículo
17” es más elevado en CT que en GS.
Volvemos a estar ante una comparación de medias, las de los precios del citado artículo, pero
ahora el diseño del muestreo es de muestras independientes. Con un abuso de la notación,
volveremos a llamar y a los precios respectivos. Ahora la hipótesis de normalidad
se traduce en à ( ) y à ( ).
Planteamos, por tanto, un contraste unilateral de comparación de medias de poblaciones
normales con varianzas desconocidas a partir de muestras independientes:
½
0 : − ≤ 0
1 : − 0
Con una confianza del 90%, el intervalo obtenido es [0452988 457761], que contiene clara-
mente al 1, por lo que podemos considerar las varianzas iguales.
Para la comparación de medias, usamos la prueba t para varianzas desconocidas pero iguales,
cuya región crítica es = [0 + −2; ], siendo el estadístico de contraste
−
0 = q à + −2
1 1
+
s
2 2
( − 1) + ( − 1)
= = 03866
+ − 2
Operando, obtenemos
724 − 698
0 = q = 1504 1734 = 18;005
1 1
03866 10 + 10
14
04352
≤ + −1; √ = 698 + 2821 √ = 7292
10
f) Para estudiar si es suficiente el número de establecimientos seleccionados de cada tipo
si se quiere que las estimaciones de los precios promedio del “Artículo 17” en GS y CT tengan
un error máximo de 001 Euros con una garantía del 99%, sabemos que
= −1;2 √ ∼= 2 √
La aproximación de la última parte es válida para grande, lo cual es previsible que ocurra al
querer un error máximo muy pequeño con una confianza muy alta. Despejando obtenemos
para cada tipo de establecimiento:
µ ¶ µ ¶
∼ 2 2 ∼ 258 × 042 2
= = = 11704
001
µ ¶2 µ ¶2
∼ 2 ∼ 258 × 035
= = = 8128
001
Luego con un -valor mayor que 02, se acepta la hipótesis de igualdad de varianzas.
A la vista del test anterior, para comprobar la hipótesis inicial, se puede hacer un contraste
de la para comparación de medias con varianzas desconocidas pero iguales. Así, calculamos
el estimador combinado de la desviación típica:
s r
(20 − 1)2 + (20 − 1)2 19 · 02342 + 19 · 02532
Pooled = = = 0244
20 + 20 − 2 38
15
y el estadístico de contraste será:
− 0744 − 0496
= q = q = 3218
1 1 1 1
Pooled 20 + 20
0244 20 + 20
Como = 3218 20+20−2;001 = 2428, se rechaza la hipótesis nula 0 y queda probado que
el filtrado con la resina A es mejor que el filtrado con la resina B.
b) Queremos tener una potencia del 90% para detectar la alternativa
| − | | − | 02
= ' = = 041
2 2Pooled 2 · 0244
Usando la carta VI(h) vemos que necesitamos ∗ ' 75 (ligeramente superior) submuestras
para tener la potencia deseada. Con 1 = 2 = = 20 tenemos ∗ = 2 − 1 = 2 · 20 − 1 = 39
y nos quedamos cortos.
c) Ahora tenemos que realizar ahora el contraste
½
0 : − ≤ 02
1 : − 02
Dado que 38;04 ' 0253 y 38;025 ' 0679, obtenemos una acotación del -valor del con-
traste anterior entre [025 04] (exactamente, el -valor vale 0269). Consecuentemente, no
tenemos evidencia estadística para realizar esa afirmación respecto a la reducción de niveles
de impurezas.
d) Sea =“Porcentaje de submuestras impuras usando filtro con resina A” y =“Por-
centaje de submuestras impuras usando filtro con resina C”. Nos interesa el contraste:
½
0 : − ≤ 0
1 : − 0
Rechazaremos la hipótesis nula (y, por tanto, sí que se puede realizar la afirmación del
enunciado) dado que = 44269 001 = 232.
16
Problema 7 a) Nos piden una cota superior al 95% para . Dado que
µ ¶
≤ + −1; √ = 095
√
tenemos que 68 + 170 · 15 30 = 727 sería el valor de dicha cota.
En la segunda parte de este apartado nos piden establecer las hipótesis 0 y 1 tales que la
región de rechazo = { 727} de lugar a un test de nivel 005 para esas hipótesis. Las
hipótesis que necesitamos son ½
0 : ≤ 68
1 : 68
¡ √ ¢
Nótese que la región de rechazo verifica = 005 = 0 + −1; · =
¡ √ ¢ ¡ ¢
68 + 170 · 15 30 = 727 .
b) Dado que los vehículos con y sin innovaciones son probados por el mismo usuario, está
bastante claro que tratamos con datos de tipo “apareado”. Quedará probado que el índice
de satisfacción medio aumenta significativamente si se rechaza 0 para el contraste
½
0 : ≤ 0
1 : 0
19
= √ = √ = 4524 30−1;001 = 246
23 30
y, por tanto, se rechaza 0 . Así, queda probada la afirmación del enunciado a nivel = 001.
c) En este apartado usaremos la carta OC (h) (test unilateral con = 001). Deseamos
una potencia = 09 ( = 1 − 09 = 01) para detectar la alternativa = | | '
| | = 0923 ' 04. Vemos que con = 30 tenemos un ' 055 01 y, por
tanto, ese tamaño muestral es insuficiente. Usando esta tabla, vemos que necesitamos entre
75 100 observaciones.
d) Ahora nos piden realizar el test
½
0 : ≤ 15
1 : 15
Usamos el estadístico
− 15 19 − 15
= √ = √ = 095
23 30
Dado que 30−1;01 = 1311 y 30−1;025 = 0683, tenemos que el -valor de este contraste es
[29 095] ∈ [01 025]. Con este -valor, lo razonable es aceptar 0 y concluimos que
no se puede afirmar que introducir innovaciones en el vehículo aumente significativamente el
índice de satisfacción medio en más de 15 puntos.
e) En el enunciado nos proponen realizar el test
½
0 : = 7
1 : 6= 7
17
© ª
usando la región de rechazo = ∈ [6 75] . La probabilidad de error de tipo I será
¡ ¢ ¡ ¢
= 0 ∈ [6 75] = =7 ∈ [6 75]
³ ³√ ´ ³√ ´´
= 1− Φ 30(75 − 7)19 − Φ 30(6 − 7)19
= 1 − (Φ(144) − Φ(−288)) = 1 − (09251 − 0002) = 00769
18