Está en la página 1de 24

Estadística 1 Grados de Ingeniería Mecánica e

Ingeniería Química
Problemas de los temas 10 y 11

Problema 1 Una población de fuentes de alimentación para ordenadores tiene un voltaje


de salida (output) que sigue una distribución normal de media 5 voltios y desviación típica
01 voltios. Se extrae una muestra aleatoria simple de 8 alimentadores.
a) Obtener la distribución muestral de .
b) Hallar la probabilidad de que el valor de  se desvíe en más de 005 voltios de la media
poblacional conocida.
c) Hallar el tamaño muestral necesario para que  se desvíe en menos de 001 voltios con
probabilidad 095.

Problema 2 Se han comprado 25 resistencias del Modelo 1 y 30 del Modelo 2. Supong-


amos que 11   125 representan los valores dados por las resistencias del Modelo 1
que se suponen independientes y normalmente distribuidas con media 100Ω y desviación
típica 15Ω y 21   230 los de las resistencias del Modelo 2 también independientes y
normalmente distribuidas con media 105Ω y desviación típica 2Ω.
a) Obtener la distribución muestral de  1 −  2 .
b) Hallar la probabilidad de que le diferencia entre las medias muestrales esté entre ±4Ω.
c) Hallar el tamaño muestral necesario para ambas muestras para que la probabilidad de
que  2 −  1  45Ω sea al menos 090.
d) Si las poblaciones no fueran normales, ¿qué podría decirse sobre la distribución de
 1 −  2?

Problema 3 Un fabricante de semiconductores toma una muestra aleatoria de 100 chips


y los pueba, clasifcándolos como defectuosos o no defectuosos. Denotemos  = 0 cuando
el chip iésimo no es defectuoso y  = 1 en el otro caso y  la proporción de defectuosos
en el proceso de fabricación.
a) Obtener la distribución muestral de la fracción de ̂ = (1 + 2 +  + 100 )100
defectuosos en la muestra.
b) Si la proporción de defectos en la población es de 006, obtener la probabilidad de que
la proporción muestral se desvíe de esa cantidad en más de 001.
a) En la misma situación, obtener el tamaño de muestra necesario para que la estimación
se desvíe en menos de 001 con una probabilidad de al menos 095.

Problema 4 Se sabe que la duración en horas de una bombilla eléctrica de 75  sigue


una distribución normal, con desviación típica  = 25. Se prueba una muestra aleatoria
de 20 bombillas y se obtiene una duración media de 1014.
a) Elaborar un intervalo bilateral de confianza del 95% con respecto a la vida media.
b) Elaborar un intervalo inferior de confianza al 99% con respecto a la vida media.
c) Si se desea obtener una confianza del 95% de que el error al estimar la duración media
sea menor de 5 horas. ¿Cuál debe ser el tamaño muestral?
Problema 5 Para comparar el porcentaje de desperdicio de dos métodos de despiece
de tableros de aglomerado, se tomaron dos muestras aleatorias de 10 tableros para ser
cortados con cada uno de los métodos. Se supone que las variables siguen distribuciones
normales y que las muestras son independientes. Las medias y desviaciones típicas fueron:
 1 = 200 1 = 15  2 = 215 2 = 13
a) Valorar estadísticamente la hipótesis de igualdad de varianzas mediante un I.C. al 90%.
b) Obtener un intervalo bilateral de confianza del 95% de 1 − 2 .
c) Obtener una cota superior de confianza del 95% de 1 − 2 .
d) Obtener una cota inferior de confianza del 95% de 1 − 2 .
e) Si se desea obtener una confianza del 95% de que el error a la hora de estimar la
diferencia de desperdicios medios entre los dos métodos sea menor que 075, ¿cuál debe
ser el número de tableros que deben cortarse con cada método?
f) Si se desea que con la misma confianza del apartado anterior el error a la hora de
estimar la diferencia de desperdicios medios entre los dos métodos sea menor que 04,
¿cuál debe ser el número de tableros que deben cortarse con cada método?

Problema 6 Se están investigando los diámetros de las barras de acero fabricadas por
dos diferentes máquinas de extrudado. Se seleccionan dos muestras aleatorias de tamaños
1 = 12 y 2 = 18, con medias y varianzas muestrales:
 1 = 875 12 = 029  2 = 863 22 = 034
Obtener lo siguiente:
a) Un intervalo bilateral de confianza del 90% de  21  22 .
b) Un intervalo bilateral de confianza del 95% de  21  22 y comparar con a).
c) Cotas superior e inferior de confianza del 90% de  21  22 .
d) Un intervalo de comparación de medias con confianza del 95%. Interpretar el resultado.
e) Si se desea obtener una confianza del 95% de que el error a la hora de estimar la
diferencia de diámetros medios entre las dos máquinas sea menor que 03, ¿cuántas barras
procedentes de cada máquina deben medirse?

Problema 7 Se fabrican bolas de rodamientos de acero para bujes de bicicletas en dos


líneas de producción, L1 y L2. El diámetro de las bolas es una variable crítica para valorar
la calidad de la producción y se sabe que sigue una distribución normal en cada una de
las líneas. Los ingenieros de calidad sospechan que podrían haberse producido algunos
desajustes en el proceso y quieren verificar que ambas líneas funcionan bajo los mismos
parámetros. Se toman dos muestras independientes, una de cada línea, y se miden los
diámetros en mm con el siguiente resultado:
1 = 16  1 = 5000 1 = 0006; 2 = 21  2 = 5005 2 = 0012
a) Comparar las varianzas de ambas poblaciones mediante un intervalo de confianza al
95% e interpretar el resultado. Sin hacer los cálculos, anticipar cuál sería la conclusión
del estudio si se hubiera realizado al 90% de confianza.
b) Comparar las medias de ambas poblaciones mediante un intervalo de confianza al 95%
e interpretar el resultado.
c) Si se quiere reducir el error máximo de la estimación conseguido en el apartado b) a tan
solo 0002, obtener los tamaños de muestra (iguales) mínimos que serían necesarios.
Problema 8 El porcentaje de individuos defectuosos en una población de tornillos es
. Se desea estimar  a partir del porcentaje observado sobre una muestra de tamaño .
Calcular el tamaño de la muestra a fin de que el error cometido sea inferior al 1% con
confianza de 09 en los casos siguientes:
a) Se sabe que   016
b) No se sabe nada sobre .
c) Se tiene una muestra piloto de tamaño 100 con una proporción muestral de defectuosos
̂0 = 007.

Problema 9 Se están empleando dos tipos diferentes de máquinas de moldeo por in-
yección para formar botellas plásticas. Se seleccionan dos muestras aleatorias, cada una
de tamaño 500, se encuentran 21 botellas defectuosas en la muestra proveniente de la
máquina 1, y 32 defectuosas en la que proviene de la máquina 2.
a) ¿Es razonable llegar a la conclusión con una confianza del 95% de que ambas máquinas
producen la misma fracción de botellas defectuosas?
b) Obtener el tamaño muestral necesario en cada muestra para que el error máximo
cometido por el I.C. para comparar las proporciones sea menor que 001 con una confianza
del 95%.
c) Obtener cotas de confianza superiores al 99% de confianza para las proporciones de
defectos de ambas máquinas.

Problema 10 El número de averías diarias que se producen en una cadena industrial


sigue una ley de Poisson. Los datos tomados de los últimos 200 días arrojan estos resul-
tados: ̄ = 137 y  = 121.
a) Obtener un intervalo de confianza al 95% para la media de averías diarias.
b) Obtener el número de días que sería necesario observar el proceso para que el error
máximo de la estimación sea de 0.1 averías con una confianza del 90%.

Soluciones

1. a) ̄ Ã (5 01 8) b) 01586 c) 385
2. a)  1 −  2 Ã (−5 0 4726) b) 0017 c) 42 d) La distribución es aproximadamente
normal para muestras grandes
µ q ¶
3. a) Por el TCL, se tiene aproximadamente ̂ Ã   (1−)

b) 05286 c) 2215. (Nota:
Se ha usado la corrección por continuidad)
4. a) 1014 ± 1096 b) 1014 − 2326 √2520 = 1014 − 13003 c) 97
5. a) (042 423) b) −15 ± 1318 c) −15 + 109 d) −15 − 109
e) Utilizando tanteo, el valor de  de los apartados anteriores y las tablas de la distribución
 se tiene que 1 = 2 = 31
f) Utilizando la fórmula para 1 y 2 grandes se tiene que 1 = 2 = 95.
6. a) (0353 2295) b) (0296) 2796) c) (0 1785) y (0429 ∞) d) 012 ± 0431
e)Utilizando tanteo, el valor de  de los apartados anteriores y las tablas de la distribución
 se tiene que 1 = 2 = 31.
7. a) IC: (0097 0690). El intervalo no contiene el valor 1 y las varianzas pueden considerarse
distintas con la confianza utilizada. Al 90% de confianza el intervalo estaría contenido en
el anterior y la conclusión sería la misma.
b) IC: (−001116 000116). El intervalo contiene el valor 0 y las medias pueden consider-
arse iguales con la confianza utilizada. Los grados de libertad obtenidos para el estadístico
son  = 3206. Como en las tablas de la asignatura se pasa de  = 30 a  = 40, se ha usado
300025 = 2042 para garantizar la confianza. El valor exacto dado por STATGRAPHICS
para el  obtenido es 2037, que llevaría a las mismas conclusiones.
c) 1 = 2 ≥ 173.
8. Usando 0025 = 1645 se tiene a) 3637 b) 6766 c) 1762
9. a) Sí, dado que el intervalo de confianza para 1 − 2 es [−00497 00057] contiene al 0.
b) 1 = 2 = 3842 (1 = 2 = 19208 si no utilizamos información sobre  y acotamos
(1 − ) por 025).
c) 00629 y 00895.
10. a) (1202 1538) b) Usando 0025 = 1645 se tiene  = 397.
Estadística 1 Grados impartidos en Paseo del Cauce
Problemas del tema 12

Problema 1 El número de llamadas telefónicas por segundo que se producen en una


centralita sigue una ley de Poisson. En un estudio se determinó que la media era 02
llamadas por segundo, pero en la actualidad se sospecha que dicha media es sensiblemente
superior, hasta el punto de saturar en ocasiones la capacidad de la centralita. Para
comprobar estadísticamente este hecho se quiere hacer un estudio basado en una muestra
de tamaño  = 13 obteniéndose: 0 0 1 1 0 2 0 0 0 1 0 1 1 llamadas en trece intervalos
de un segundo elegidos al azar e independientemente. Se pide:
a) Elaborar una regla de decisión basada en el número total de llamadas recibidas en esos
13 segundos para contrastar las hipótesis:
0 :  = 02
1 :   02
a nivel  = 005 y contrastar dicha hipótesis con la muestra obtenida.
b) Obtener la potencia de la regla elaborada en a) para detectar la alternativa  = 05.

Problema 2 Un jugador piensa que un dado está sesgado a favor del 6. Para contrastar
su creencia lanza el dado 5 veces.
a) Establecer las hipótesis nula y alternativa.
b) Sea  el número de veces que aparece el 6. Considerar la región crítica  = { ≥ 2}.
Calcular el nivel y la potencia en  = 15.

Problema 3 Una máquina produce varillas de acero cuya longitud tiene distribución
normal. Se quiere estudiar la longitud media de las varillas sabiendo que la desviación
típica es  = 02.
a) Contrastar 0 :  = 10 contra 1 :   10 a nivel  = 005 en base a una muestra de
tamaño 10 con las siguientes medidas
982 973 985 991 986 972 987 992 963 979.
b) ¿Cuál es el tamaño de la muestra a partir del cual  ≤ 01 si la verdadera media de la
población es de 98?
c) Repetir el apartado b) con el contraste 0 :  = 10 contra 1 :  6= 10.

Problema 4 Dada la m.a.s. 139 151 1202 1325 1601 1503 1405 146 1222 de una
población con distribución normal de media  y desviación típica conocida  = 162. Con-
trastar las siguientes hipótesis a nivel  = 005:

a) 0 :  = 13 b) 0 :  = 15
1 :  6= 13 1 :  6= 15
Observar que en ambos casos no es posible rechazar la hipótesis nula.
Problema 5 Se toma una muestra de tamaño 16 de una población ( 2 ) para con-
trastar 0 :  = 52 contra 1 :   52. Sea 2 = 016 conocido y  = 54. Obtener el
nivel más pequeño al que es posible rechazar la hipótesis nula.

Soluciones
1) a) Rechazar si el “número total de llamadas” es estrictamente mayor que 5. Con estos
datos se rechazaría la hipótesis nula. b) 0631.
2) a) 0 :  = 16 y 1 :   16. b) “Nivel" = 01962 y “Potencia"=026272.
3) a) Región de rechazo  = {  9895} y se rechaza 0 puesto que ̄ = 981. b)  ≥ 9
c)  ≥ 11.
4) Las regiones de rechazo son 1 = {| − 13|  10584} y 2 = {| − 15|  10584}.
Con  = 1402 no se rechaza ninguna de las dos hipótesis nulas.
5) 00228.
Estadística 1o Grados de Ingeniería Mecánica e
Ingeniería de Organización Industrial
Problemas del tema 13

Problema 1 En un estudio realizado en Inglaterra se midió el consumo semanal de gas


natural en 3 para una muestra aleatoria de 26 semanas antes de instalar un sistema de
aislamiento térmico en las paredes de una determinada casa (“Antes”). Después de la insta-
lación del aislamiento, se consideró otra muestra aleatoria de 26 semanas (“Después”) y se
midieron los consumos de gas semanales en esa misma casa. Los resultados del estudio se
resumen en las siguientes tablas:
1 2 4  26 Media Desv. Típic.
Antes 7.2 6.9 6.4  2.6 1 = 475 1 = 116
Después 4.8 4.6 3.9  4.7 2 = 347 2 = 087
Diferencias -2.4 -2.3 -2.5  2.1  = −128  = 062

(en las tablas anteriores las desviaciones típicas que aparecen están corregidas y podemos
suponer que la hipótesis de normalidad es razonable donde la necesitemos).

a) A partir de la muestra del estudio, obtén una cota inferior de garantía 95% para el
consumo medio de gas en esa casa antes de instalar el aislamiento.
b) Usando la información que necesites de las tablas anteriores, ¿Podemos suponer que
el consumo medio semanal de gas se reduce significativamente con el aislamiento? Da
una acotación razonable para el -valor del contraste planteado.
c) ¿Con qué probabilidad detectaríamos una reducción en el consumo semanal medio de
gas en 13 ó más mediante el contraste del apartado b) trabajando a nivel  = 005?
d) ¿Permiten los datos afirmar a nivel  = 005 qué el aislante sirve para reducir signi-
ficativamente el consumo semanal medio en más de 13 ?
e) Supongamos, ahora, que la desviación típica para el consumo de gas antes de la insta-
lación del aislamiento es conocida e igual a  = 113 . Para analizar si el consumo
medio puede suponerse igual a 53 (0 :  = 5) realizamos un test consistente en
rechazar 0 si la media muestral ̄ no está dentro del intervalo [45 525]. Determina
la probabilidad de error tipo I y la probabilidad de error II en la alternativa  = 553
para esta regla de decisión basada en muestras de  = 26 observaciones.

Problema 2 En un estudio realizado en Valladolid sobre el mercado inmobiliario provincial


se recogió una muestra aleatoria de 500 operaciones de compraventa realizadas cada uno de
los años 2005 y 2006 y se anotaron variables como: VALOR (miles de euros), SUPERFICIE
(m2 ), ZONA, ANTIGÜEDAD, PRECIO (2 ), etc.

a) La muestra incluye 31 operaciones en el barrio B1 realizadas en 2006, obteniéndose


para la variable PRECIO el siguiente resumen:  = 2533 4,  = 500 2. Suponiendo
normalidad, obtener una cota inferior de confianza para  al 95%.

1
b) En relación con el mercado de viviendas unifamiliares en la ZONA del Alfoz de la
capital, en el estudio aparecen 26 operaciones realizadas en el primer trimestre de 2005
y otras 26 en el mismo trimestre de 2006. Los resultados del estudio para la variable
VALOR en unidades logarítmicas se resumen en la siguiente tabla:
1 2 4  26 Media Desv. Típic.
2005 5.65 5.66 5.83  5.49 1 = 566 1 = 032
2006 5.90 5.99 5.69  5.71 2 = 584 2 = 028
Diferencias 0.25 0.33 -0.14  0.22  = 018  = 037

Estudiar si se ha producido un aumento significativo de la media de los valores en


unidades logarítmicas para  = 005 y acota el -valor (suponer normalidad).

c) ¿Permiten los datos afirmar a nivel  = 005 que se ha producido un aumento de la


media de los valores en unidades logarítmicas de 005 ó más?

d) ¿Con qué probabilidad detectaríamos un aumento de la media de los valores en unidades


logarítmicas de 025 ó más mediante el contraste del apartado b)?

Problema 3 Se instala un dispositivo de filtrado en una unidad química. Antes de su


instalación, una muestra aleatoria de tamaño 12() proporcionó información acerca del
porcentaje de impurezas. Después de la instalación del dispositivo se tomó otra mues-
tra ( ) también de tamaño 12. Los resultados de ambas muestras fueron los siguientes:
X Y Dif.
---------------------
18,25 7,94 10,31
9,41 15,74 -6,33
28,92 11,54 17,38 X Y Dif.
18,47 11,77 6,7 ----------------------------------------------------------------------
33,98 14,56 19,42 Count 12 12 12
21,22 13,22 8 Average 19,735 10,4208 9,31417
12,32 -1,68 14 Variance 102,441 20,8105 107,638
16,28 8,21 8,07 ----------------------------------------------------------------------
29,18 13,22 15,96
32,55 8,16 24,39
16,39 10,48 5,91
-0,15 11,89 -12,04
---------------------

Suponiendo normalidad y que las varianzas de las dos poblaciones pueden suponerse idénti-
cas:

a) ¿Puede afirmarse que el filtro es efectivo reduciendo el porcentaje de impurezas?


Plantea el contraste adecuado y da las conclusiones de dicho contraste a nivel 001.

b) ¿Las observaciones que se tomaron en las muestras  e  eran suficientes para poder
detectar al menos el 90% de las veces una reducción en el porcentaje de impurezas
superior al 5% en el contraste realizado en a)? ¿Cuántas observaciones serían necesarias
para garantizar esa potencia?

c) ¿Están los datos de acuerdo en que se ha reducido el porcentaje de impurezas al colocar


el filtro en al menos un 5%? Da una acotación del -valor para el contraste planteado.

El investigador tiene serias dudas respecto al hecho de que las varianzas puedan suponerse
iguales:

2
d) Realiza un test para ver si las varianzas pueden suponerse idénticas a nivel  = 005.

e) ¿Podemos afirmar que se ha producido una reducción en las variabilidad de los por-
centajes de impurezas al instalar el filtro trabajando a nivel  = 001? Proporciona una
cota inferior al 95% para el número de veces que es mayor dicha variabilidad cuando
no se usa el filtro respecto a cuando sí se usa.

f) A la vista del resultado del apartado d), ¿se puede plantear algún contraste alternativo
aproximado para ver si el filtro es efectivo? Da las conclusiones de dicho contraste.

Problema 4 Se miden los diámetros en  de 20 tuercas con un calibre analógico y también


con un calibre digital. Los resultados de las mediciones realizadas son:
Analog Digit Dif
--------------------
1 22.55 22.47 -0.08
2 23.13 22.70 -0.43
Analog. Digit Dif
3 23.31 22.55 -0.76
-------------------------------------------------------------
4 22.77 22.18 -0.58
Count 20 20 20
5 22.06 22.39 0.33
Average 22.545 22.311 -0.234
...
Standard deviation 0.398 0.167 0.326
18 22.34 22.13 -0.21
-------------------------------------------------------------
19 22.02 22.26 0.24
20 22.70 22.43 -0.27
--------------------

a) ¿Podemos afirmar que el calibre analógico proporciona mediciones de diámetro mayores


en promedio que el calibre digital? Plantea el contraste adecuado y da las conclusiones
de dicho contraste a nivel 001.

b) ¿Podemos afirmar que esa diferencia entre diámetros medios al medir con los dos
tipos de calibres sea superior a 01trabajando a nivel 001? Obtén una acotación
razonable del -valor.

c) ¿El tamaño muestral considerado en este estudio fue suficiente para detectar una dife-
rencia en medias de 02 con una garantía del 90% en el contraste realizado en el
apartado a)? ¿Qué tamaño muestral necesitamos?

d) Obtén intervalos de confianza de garantía 95% para las desviaciones típicas pobla-
cionales de las mediciones obtenidas con el calibre analógico y con el digital. ¿Po-
dríamos decidir a partir de estos intervalos de confianza qué tipo de calibre es mejor?
¿Una posible diferencia entre desviaciones típicas poblacionales podría afectar a la
validez de los procedimientos estadísticos aplicados en los apartados a), b) y c)?

e) Contamos con dos fábricas A y B dedicadas a producir este tipo de tuerca. Se considera
que una tuerca es defectuosa si su diámetro no está entre 22 y 23 . El fabricante A
nos asegura que a lo sumo sólo un 2% de las tuercas que comercializa son defectuosas.
Usando un calibre digital fiable vemos que en un lote de 5000 tuercas de dicho fabricante
hay 113 defectuosas. A partir de esta muestra, ¿podemos garantizar que la afirmación
del fabricante no es cierta a nivel  = 001?

3
f) En un lote de 4000 tuercas (también aleatoriamente seleccionadas) del fabricante B en-
contramos 79 tuercas defectuosas. ¿Existen diferencias estadísticamente significativas
en la proporción de tuercas defectuosas a favor de algún fabricante? Da una acotación
razonable para el -valor del contraste realizado.

Problema 5 Una Asociación de Consumidores realiza un estudio comparativo de los pre-


cios de los artículos de alimentación en “Grandes Superficies" (GS) y en “Comercios Tradi-
cionales" (CT) con el objetivo de aportar evidencia estadística para probar la sospecha de
que los precios en CT son superiores. El estudio diseñado consistió en tomar una muestra
aleatoria de 25 artículos que se venden en establecimientos de los dos tipos y anotar los
precios de venta en euros de dichos artículos en ambos tipos de establecimientos. Se supone
válida la hipótesis de normalidad donde se necesite.

Tipo Art. 1 Art. 2 ... Art. 25  


GS 3.25 14.79 ... 0.59 10.21 3.12
CT 3.49 13.56 ... 0.90 10.76 3.51
Diferencia -0.24 1.23 ... -0.31 -0.55 1.50

a) Plantear y contrastar las hipótesis apropiadas para  = 005. Dar una acotación
razonable del -valor.

b) Estudiar si es suficiente el número de artículos estudiados para que el test realizado en


el apartado a) pueda detectar una diferencia de 06 con una probabilidad de 090.

c) Si la sospecha hubiera sido que los precios en CT son al menos 025 superiores en
promedio, plantear y contrastar de nuevo las hipótesis apropiadas para  = 005. Dar
una acotación razonable del -valor.

Como el precio de cada uno los artículos varía de unos establecimientos comerciales a otros,
se consideró para cada artículo el precio promedio observado en 10 establecimientos de cada
tipo elegidos aleatoriamente.

d) De los 10 precios observados en CT para el Artículo 17, la media fue de 724, con
una desviación típica (corregida) de 042, mientras que en GS la media fue de 698
con una desviación típica (corregida) de 035. Se puede afirmar estadísticamente que
el precio medio de dicho artículo es superior en CT. Dar una acotación razonable del
-valor.

e) Construir cotas superiores de confianza al 99% para el precio medio del Artículo 17 en
ambos tipos de establecimientos.

f) Estudiar si es suficiente el número de establecimientos seleccionados de cada tipo si se


quiere que las estimaciones de los precios promedio del Artículo 17 en GS y CT tengan
un error máximo de 001 Euros con una garantía del 99%. ¿Cuántos establecimientos
necesitaríamos de cada tipo?

4
Problema 6 Un proceso de purificación para un producto químico implica pasar la solución
química a través de una resina que absorbe sus impurezas. Un ingeniero decide testar la
eficiencia de dos resinas A y B. Con este fin, se toma una muestra de la solución química,
que se divide en 40 submuestras. Finalmente, tras filtrar cada una de esas submuestras
usando alguno de los dos tipos de resina, se mide la concentración de impurezas en % . Los
resultados obtenidos se resumen en la siguiente tabla:
A B Dif
---- ---- ----
1 0.77 1.01 0.24 Media de A = 0.496
2 0.72 0.94 0.22 Desviación típica (corregida) de A = 0.234
3 0.69 0.55 -0.14 Media de B = 0.744
4 0.01 0.47 0.48 Desviación típica (corregida) de B = 0.253
5 0.39 0.92 0.53 Media de "Dif" = 0.248
... ... ... Desviación típica (corregida) de "Dif" = 0.280
19 0.69 0.67 -0.02
20 0.24 0.86 0.62

Suponiendo normalidad cuando sea necesario:

a) ¿Puede afirmarse a nivel  = 001 que la resina A es mejor que la resina B para reducir
los niveles de impurezas medios en ese producto químico?

b) Se desea poder detectar con el test anterior una reducción en los niveles medios de
impurezas de 02% a favor de la resina A con una seguridad del 90%. ¿Fue el número
total de submuestras analizado suficiente? ¿Cuantas submuestras serían necesarias?

c) ¿Podemos afirmar que se produce una reducción de al menos el 02% a favor de la


resina A respecto a la resina B? Proporciona una acotación adecuada para el -valor
del test asociado.

Se vuelven a tomar otras 200 submuestras de la solución química y se mide la concentración


de impurezas tras ser filtradas usando la resina A. Se repite el mismo procedimiento con otras
200 submuestras y, ahora, usando una nueva resina C. Se obtienen los siguientes resultados:

[0 05]% (05 08]% [08 10]%


Resina A 111 76 13
Resina C 67 94 39

d) El producto químico filtrado es etiquetado como “impuro" si el porcentaje de impurezas


es superior al 05%. A la vista de la tabla anterior, ¿se puede afirmar que el porcentaje
de submuestras impuras que se obtendrían a partir de esta solución química es mayor
usando la resina C que usando la resina A?

Problema 7 Un experimento en una empresa automovilística trata de analizar si las innova-


ciones que se proponen realizar en un modelo concreto de vehículo realmente producen una
mejora constatable por el usuario. Para ello, se toma una muestra aleatoria de 30 posibles
usuarios y cada uno de ellos prueba dos vehículos, del mismo modelo, uno sin las innovaciones

5
(vehículo A) y otro con las innovaciones (vehículo B). Así, cada usuario asigna puntuaciones
que permiten generar un índice de satisfacción para cada vehículo, A y B, cuyo valor varía
de 0 (nada satisfecho) a 10 (muy satisfecho) puntos. Se obtienen los siguientes resultados
siendo  =“Índice satisfacción con vehículo A” e  =“Índice satisfacción con vehículo B”:

Usuario    = −
1 5 8 3
2 4 7 3
... ... ... ...
29 6 7 1
30 4 5 1
Media 4.9 6.8 1.9
Desv. típica (corr.) 1.6 1.5 2.3

a) Obtén una cota superior de garantía del 95% para el índice de satisfacción media del
vehículo con innovaciones. Plantea hipótesis 0 y 1 tales que esta cota permita definir
una región de rechazo de tal forma que el contraste asociado tenga nivel  = 005.

b) ¿Se puede suponer que el índice de satisfacción medio aumenta significativamente in-
troduciendo las innovaciones en el vehículo? Plantea el contraste adecuado y da sus
conclusiones a nivel  = 001.

c) Determina si fue suficiente el número de usuarios utilizado para que el test del apartado
b) pueda detectar una diferencia de 09 puntos con una probabilidad del 90%. En el caso
de que el número no sea suficiente, ¿cuántos usuarios en la muestra serían necesarios?

d) ¿Permiten los datos afirmar que introducir innovaciones en el vehículo aumenta signi-
ficativamente el índice de satisfacción medio en más de 15 puntos? Da una acotación
razonable para el -valor del contraste asociado.

e) Supongamos, ahora, que la desviación típica para el índice de satisfacción con el ve-
hículo B se conoce y es igual a 19 Para analizar si la satisfacción media con el vehículo
B se puede suponer igual a 7 puntos se realiza un test consistente en rechazar dicha
hipótesis si la media muestral  no está dentro del intervalo [6 75]. Determina la
probabilidad de error tipo I y la probabilidad de error tipo II en el caso de que la
media verdadera sea 75 para esta regla de decisión basada en 30 observaciones.

6
Soluciones a los problemas del tema 13

Problema 1 Lo primero que conviene señalar a la luz del planteamiento que se hace en el
enunciado del problema, es que estamos ante un estudio estadístico de comparación de dos
poblaciones normales a partir de dos muestras independientes. Nótese que en el enunciado
del problema no se da ninguna información que permita pensar que la observación primera de
la muestra “Antes” esté relacionada con la observación primera de la muestra “Después” en
mayor medida que con cualquier otra observación de las de dicha muestra (son días distintos,
con temperaturas distintas, etc.).
Utilizaremos la notación 1 Ã (1   1 ) para el consumo “Antes” y 2 Ã (2   2 )
para el consumo “Después”.
a) Tenemos que obtener un IC al 95% para 1 con  1 desconocida:
√ √
 ≥ 1 − −1 · 1   = 475 − 1708 · 116 26 = 436

b) Tenemos un problema de comparación de medias a partir de dos muestras indepen-


dientes. Primero, probaremos que podemos suponer que las varianzas de las dos muestras
son iguales. Usando la distribución  , obtenemos que [0 794 398] es un IC para  21  22 de
garantía 95%. El IC contiene al 1 y podemos suponer  21 =  22 . Nótese que esta manera de
proceder es equivalente a la realización de una prueba de hipótesis bilateral de comparación
de varianzas.
De este modo, realizamos el test de comparación de medias con varianzas iguales y
desconocidas: ½
0 : 1 − 2 ≤ 0

1 : 1 − 2  0
El estadístico de contraste es:
 − 2 475 − 347
= q1 = q = 45
 11 + 12 1025 261
+ 261

( = 1025 es la desviación típica “combinada” o “pooled”). Vemos que el -valor del


contraste es menor que 00005 y se rechaza 0 . De este modo, queda estadísticamente
probado que la instalación de aislante reduce significativamente el consumo semanal de gas.
c) Usaremos las cartas de curvas OC para la  unilateral (Carta VIg) con  = 1(2 ·
10253) = 04876. Para  = 1 = 2 = 26, entramos en la carta con ∗ = 2 − 1 ' 50.
Vemos que 005 ≤  ≤ 01 y 090 ≤  ≤ 095.
d) Ahora, se nos pide realizar el test:
½
0 : 1 − 2 ≤ 1

1 : 1 − 2  1

Usamos el estadístico:
1 − 2 − 1 475 − 347 − 1
= q = q = 09846
1 1 1 1
 1 + 2 1025 26 + 26

7
Como 1 +2 −2005 = 1676, no se rechaza 0 (01  -valor 025) y no se puede afirmar
que el aislante reduzca en más de 13 el consumo de gas semanal.
e) Se nos pide evaluar las probabilidades de error  y  si realizamos el contraste de
hipótesis ½
0 : 1 = 5
1 : 1 6= 5
utilizando como región de aceptación 1 ∈ [45 525]

 =  (“Error I”) =  (Rechazar 0 0 es cierta)


µ µ ¶ ¶
11
=   5 √ ∈
 [45 525] = 01335
26
y, análogamente,
( = 55) =  (“Error II”( = 55)) =  (No rechazar 0 0 es falsa con  = 55)
µ µ ¶ ¶
11
=   55 √ ∈ [45 525] = 01233
26

Problema 2 a) Para obtener una cota inferior de confianza para  al 95% bajo hipótesis de
normalidad, aplicamos la fórmula correspondiente:
( − 1) 2 (31 − 1) · 50022 30 · 50022
2 ≥ = = = 17148735
2−1 231−1005 4377
es decir,  ≥ 41411
b) Utilizaremos la notación 1 Ã (1   1 ) para la variable VALOR (en unidades log.)
de las operaciones realizadas en el primer trimestre de 2005 y 2 Ã (2   2 ) para el año
2006. Nos piden realizar una comparación de las medias de los dos años y la primera discusión
que surge es si el diseño muestral realizado es el correspondiente a muestras independientes o
apareadas. Del enunciado del primer párrafo del problema se desprende de manera obvia que
las muestras son independientes. Además, no se da ninguna información que permita pensar
que cada observación de la fila correspondiente al año 2005 tenga respecto a la observación
del año 2006 que está justo debajo de ella alguna vinculación especial diferente de la que
pudiera tener con cualquier otra observación de dicha fila. De este modo, la información
presentada sobre las diferencias no tiene ninguna utilidad para el problema.
Primero, probaremos que podemos suponer que las varianzas de las dos poblaciones son
iguales. Usando la distribución  y las fórmulas habituales, obtenemos que [059 293] es
un IC para 21  22 con confianza del 95%. El IC contiene al 1 y podemos suponer  21 =  22 .
Nótese que esta manera de proceder es equivalente a la realización de una prueba de hipótesis
bilateral de comparación de varianzas.
Para estudiar si se ha producido un aumento significativo de los valores medios de los
inmuebles en unidades logarítmicas, tenemos que plantear el contraste unilateral de com-
paración de medias con varianzas iguales y desconocidas:
½
0 : 2 − 1 ≤ 0

1 : 2 − 1  0

8
El estadístico de contraste es:
 − 1 584 − 566
= q2 = q = 213
 11 + 12 030 261 1
+ 26

( = 030 es la desviación típica “combinada” o “pooled”). En las tablas vemos que el


-valor del contraste satisface 001   −   0025 y se rechaza 0 para  = 005. De
este modo, queda estadísticamente probado un aumento significativo de los valores medios
en unidades logarítmicas.
c) Para ver si se ha producido un aumento en los valores medios de al menos 005 unidades
logarítmicas planteamos el contraste de hipótesis
½
0 : 2 − 1 ≤ 005

1 : 2 − 1  005
Volviendo a considerar las varianzas desconocidas e iguales, el estadístico de contraste es:
2 − 1 − 005 584 − 566 − 005
= q = q = 154
1 1 1 1
 1 + 2 030 26 + 26

Como el valor crítico a nivel  = 005 es 50005 = 1676, no podemos rechazar 0 y


no queda estadísticamente probado el aumento sugerido. El p-valor estaría en el intervalo
(005 010).
d) Se nos pide la potencia con la que el test realizado en el apartado ) sería capaz de
detectar un aumento de los valores medios de 025 o más en unidades logarítmicas. Usaremos
las cartas de curvas OC para la prueba  unilateral (Carta VIg) con  = 025(2·03) = 0417.
Para  = 1 = 2 = 26, entramos en la carta con ∗ = 2 − 1 ' 50. Vemos que  ' 01
y por tanto  ' 090. Es decir, un aumento de esas caracteríaticas sería muy probablemete
detectado por la prueba realizada basada en dos muestras independientes de tamaño 26.

Problema 3 a) Nos piden el test (para dos poblaciones independientes) siguiente:


½
0 :  ≤ 

1 :   

Como se nos dice que las varianzas son idénticas, usaremos el estadístico  para comparación
de medias con varianzas desconocidas pero iguales. Así, calculamos el estimador combinado
de la varianza dado por
2
2 (12 − 1) + (12 − 1)2 11 · 10244 + 11 · 2081
Pooled = = = 6163
12 + 12 − 2 12 + 12 − 2
p
2
y el estimador de  dado por Pooled = Pooled = 784. Por tanto,

 − 19735 − 10421
= q = q = 291
1 1 1 1
Pooled 12
+ 12
784 12 + 12

9
Como  = 291  12+12−2;001 = 251, se rechaza la hipótesis nula 0 y queda probada la
efectividad del dispositivo de filtrado.
b) Queremos tener una potencia del 90% para detectar la alternativa
 −   −  5
= '  = = 031
2 2Pooled 2 · 784
Usando la carta VI(h) vemos que necesitamos ∗ ' 100 para tener la potencia deseada (con
1 = 2 =  = 12 tenemos ∗ = 2 − 1 = 23 y nos quedaríamos cortos). Por tanto, se
necesitan 1 = 2 = (∗ + 1)2 ' 50.
c) Debemos realizar ahora el contraste
½
0 :  ≤  + 5

1 :    + 5
Con este fin, usaremos
 − −5 19735 − 10421 − 5
= q = q = 135
1 1 1 1
Pooled 12 + 12 784 12 + 12

Viendo que 22;01 = 132 y 22;005 = 172, llegamos a un -valor entre [005 01] (más próximo
a 01). Consecuentemente, no tenemos evidencia estadística para realizar esa afirmación a
nivel  = 005.
d) Realizaremos un contraste de igualdad de varianzas:
½
0 :  2 =  2

1 :  2 6=  2
2
Usaremos el estadístico de contraste  =  2 = 102442081 = 492. Rechazamos la
hipótesis nula si ∙ ¸
1
 ∈  1111;2 
1111;2
Como 1111;0025 = 347, se rechaza la hipótesis nula a nivel  = 005 y, por tanto, las
varianzas no pueden suponerse idénticas a ese nivel.
e) Ahora planteamos el contraste de un lado:
½
0 :  2 ≤  2

1 :  2   2
Como  = 492  1111;001 = 446, se puede afirmar a nivel  = 001 que se ha producido
una reducción en las variabilidades de los porcentajes de impurezas al instalar el filtro. La
cota inferior de confianza al 95% tiene la forma
 2 2
 1 1
2
≥ 2
= 492 · = 1746 (veces).
  1111;005 282
f) Volvemos a realizar el contraste
½
0 :  ≤ 

1 :   

10
pero ahora (a la vista de los apartados d) y e)) suponemos varianzas desconocidas y distintas.
Usamos el estadístico
 − 19735 − 10421
= q 2 2
= q = 291
  10244 2081
12
+ 12 12
+ 12

Este estadístico bajo la hipótesis nula sigue aproximadamente una  con


³ 2 ´2
 2
1
+ 2
 =  2 2  2 2 − 2 = 1607 ' 16
 
1 1

1 +1
+ 2 +1

Como  = 291  16;01 = 258, se rechaza también la hipótesis nula a nivel  = 001 y queda
probada la efectividad del filtro.

Problema 4 Dada la estructura de los datos estamos ante claramente ante un problema de
datos pareados.
a) Para  = Digital − Analog planteamos el contraste
½
0 :  ≥ 0

1 :   0
Usamos el estadístico
 −0234
= √ = √ = −321
   0326 20
y vemos que −321  −20−1;001 = −254. Por tanto, se rechaza la hipótesis nula y queda
probada la afirmación del enunciado.
b) Ahora debemos realizar el test
½
0 :  ≥ −01
1 :   −01
con el estadístico de contraste
 − (−01) −0234 + 01
= √ = √ = −183
   0326 20
El -valor será  (19  −183) = 0041 (con las tablas sólo se puede ver que está entre 0025
y 005). Por tanto, no queda probada esa afirmación a nivel  = 001
c) Debemos estudiar la potencia del test del primer apartado (con  = 001 y “unila-
teral"). Para entrar en las tablas usamos  = 020326 = 062 y vemos que con  = 20 la
probabilidad de error tipo II es  ' 04. Para tener la potencia  = 09 deseada se necesitan
aproximadamente  = 40 pares de datos.
d) El intervalo de confianza de garantía 95% para la varianza del calibre analógico es
∙ ¸
(20 − 1)03982 (20 − 1)03982
 = [0092 0338]
2190025 2190975

11
y para el calibre digital será
∙ ¸
(20 − 1)01672 (20 − 1)01672
 = [0016 0059]
2190025 2190975

Tomando raices cuadradas en los extremos de estos intervalos tenemos los intervalos de
confianza [0303 0581] y [0127 0244] para las desviaciones típicas de los calibres analógico
y digital, respectivamente. Aunque estos intervalos no están solapados (o aunque el intervalo
para el cociente de varianzas no contenga el valor 1) no se invalida lo realizado en los
apartados a), b) y c). Nótese que estamos realizando un test “ por pares” donde no se exige
ninguna hipótesis de igualdad de varianzas.
No podemos decir qué calibre es el mejor sólo a partir de estos intervalos. Una menor
varianza, en principio, nos indicaría una mayor precisión del aparato de medida pero debemos
tener en cuenta si el calibre está bien “calibrado” o por el contrario está “sesgado”. Sin esa
información no está claro cuál es el mejor calibre.
e) Para ver si la afirmación es correcta debemos realizar el test
½
0 :  ≤ 002

1 :   002

Usamos
b − 002 00226 − 002
=q = q = 131
002(1−002) 002(1−002)
5000 5000

No tenemos evidencia estadística para afirmar que lo comentado por el fabricante no pueda
ser cierto ya que 131  001 = 232.
f) Si  y  son las fracciones de defectuosas para las fabricas  y , debemos realizar
ahora el test de comparación de proporciones
½
0 :  = 

1 :  6= 

Como b = 1135000 = 00226, b = 794000 = 00198 y el estimador combinado es


b = (113 + 79)(5000 + 4000) = 021 tenemos un valor del estadístico de contraste

b − b
=q ¡ 1 ¢ = 0937
1
b(1 − b) 5000 + 4000

El -valor de dicho test será 2(1 − Φ(0937)) = 0349 y, por tanto, no detectamos diferencias
significativas a los niveles habituales para las fracciones de defectuosos entre las dos fábricas.

Problema 5 Para realizar la comparación de precios entre Comercios Tradicionales (CT) y


Grandes Superficies (GS) planteada por la Asociación de Consumidores, tendremos que llevar
a cabo un estudio de comparación de medias ( −  ) de las dos poblaciones de precios
 y  . Como sabemos, los estudios de comparación de medias se pueden diseñar
a partir de muestras independientes o de muestras apareadas. Los diseños de muestras

12
apareadas tienen la ventaja de permitir observar las diferencias con más potencia debido a la
reducción de la variabilidad proporcionada por el apareamiento de las observaciones. En este
caso, se ha planteado un diseño claramente de muestras apareadas. Se ha seleccionado una
muestra de 25 artículos y se han anotado para cada uno de ellos el precio en los dos tipos de
establecimientos. Cada par está formado por los dos precios observados para cada artículo
en CT y en GS. Lógicamente, al tratarse en cada par del mismo artículo, las diferencias de
precios se deberán básicamente a la distinta naturaleza de los establecimientos comerciales.
En el enunciado se nos dice que se asume la hipótesis de normalidad donde sea necesaria.
En el caso de muestras apareadas, sabemos que sería suficiente tener la normalidad para la
población de las diferencias  =  −  ,  Ã (    ) ( =  −  ).
a) En este apartado se pide probar la hipótesis (1 ) de que los precios medios en CT son
más elevados que en GS. Planteamos por tanto un contraste unilateral de comparación de
medias para muestras apareadas bajo hipótesis de normalidad.
½
0 :  = 0
1 :   0
La región crítica es  = [0  −1; ], siendo el estadístico de contraste


0 = √ Ã −1 
  
Operando, obtenemos
 055
0 = √ = √ = 1833  17109 = 24;005 
   150 25
por lo que al nivel de significación  = 0 05 rechazamos 0 y concluimos que los precios
son significativamente más altos en media en CT. Con nuestras tablas, podemos decir que
0025  -valor 005 (00396).
b) Se nos pide estudiar si el tamaño muestral utilizado para la prueba realizada en a)
permitiría detectar una diferencia medias  = 06 Euros con una potencia  = 09. Para
ello usamos las Curvas OC, concretamente la Carta  , y observamos que se necesitarían
aproximadamente  = 50 observaciones (pares). Con las  = 25 observaciones utilizadas,
tendríamos una potencia de apenas  = 063.
c) En este apartado se pide probar la hipótesis (1 ) de que los precios medios en CT son
al menos 025 Euros más elevados que en GS. Ahora el contraste de hipótesis pedido sería
½
0 :  ≤ 025
1 :   025
La región crítica es de nuevo  = [0  −1; ], siendo ahora el estadístico de contraste

 − 025
0 = √ Ã −1 
  
Operando, obtenemos
 − 025 055 − 025
0 = √ = √ = 1  17109 = 24;005 
   150 25

13
por lo que al nivel de significación del  = 005 no podemos rechazar 0 y concluimos que
no queda probada la existencia de la mencionada diferencia de 025 Euros a favor de CT.
Con nuestras tablas, podemos decir que 010   −   025 (01636).
d) En el enunciado nos dicen que, dado que el precio de cada uno de los artículos varía de
unos establecimientos comerciales a otros, los precios de los artículos se obtuvieron prome-
diando los precios observados en 10 establecimientos de cada tipo elegidos aleatoriamente.
Con esta información, se nos pide probar la sospecha (1 ) de que el precio medio del “Artículo
17” es más elevado en CT que en GS.
Volvemos a estar ante una comparación de medias, las de los precios del citado artículo, pero
ahora el diseño del muestreo es de muestras independientes. Con un abuso de la notación,
volveremos a llamar  y  a los precios respectivos. Ahora la hipótesis de normalidad
se traduce en  Ã (    ) y  Ã (    ).
Planteamos, por tanto, un contraste unilateral de comparación de medias de poblaciones
normales con varianzas desconocidas a partir de muestras independientes:
½
0 :  −  ≤ 0
1 :  −   0

Hacemos primero una comparación de varianzas mediante un intervalo de confianza:


2
 1  2 2

2
≤ ≤  −1; −1;2 
  −1; −1;2  2 2


Con una confianza del 90%, el intervalo obtenido es [0452988 457761], que contiene clara-
mente al 1, por lo que podemos considerar las varianzas iguales.
Para la comparación de medias, usamos la prueba t para varianzas desconocidas pero iguales,
cuya región crítica es  = [0   + −2; ], siendo el estadístico de contraste

  −  
0 = q à  + −2 
1 1
  + 
s
2 2
( − 1) + ( − 1)
 = = 03866
 +  − 2
Operando, obtenemos
724 − 698
0 = q = 1504  1734 = 18;005 
1 1
03866 10 + 10

por lo que al nivel de significación  = 005 no podemos rechazar 0 y concluimos que no


queda probado que los precios del “Artículo 17” sean significativamente más altos en media
en CT. Con nuestras tablas, podemos decir que 005   −   010 (0075).
e) Para construir cotas superiores de confianza al 99% para el precio medio del Artículo
17 en ambos tipos de establecimientos, tenemos
 042
 ≤   +  −1; √ = 724 + 2821 √ = 7615
 10

14
 04352
 ≤   +  −1; √ = 698 + 2821 √ = 7292
 10
f) Para estudiar si es suficiente el número de establecimientos seleccionados de cada tipo
si se quiere que las estimaciones de los precios promedio del “Artículo 17” en GS y CT tengan
un error máximo de 001 Euros con una garantía del 99%, sabemos que
 
 = −1;2 √ ∼= 2 √ 
 
La aproximación de la última parte es válida para  grande, lo cual es previsible que ocurra al
querer un error máximo muy pequeño con una confianza muy alta. Despejando  obtenemos
para cada tipo de establecimiento:
µ ¶ µ ¶
∼ 2  2 ∼ 258 × 042 2
 = = = 11704
 001
µ ¶2 µ ¶2
∼ 2  ∼ 258 × 035
 = = = 8128
 001

Problema 6 a) Se trata claramente de un problema de dos muestras independientes. Nótese


que no existe ningún tipo de “relación especial” entre la medición número 1 con la resina A
y la medición número 1 con la resina B; ni entre la medición número 2 con la resina A con
la medición número 2 con la resina B, etc. Nos piden realizar el test (para dos poblaciones
independientes) siguiente: ½
0 :  ≤ 
1 :   
Lo primero que debemos hacer es comprobar si podemos suponer que las dos poblaciones
tienen varianzas idénticas. Así, realizaremos primero el contraste:
½
0 :  2 =  2
1 :  2 6=  2

Usaremos el estadístico de contraste


2 02342
 = = = 0855 ∈ [1919;09  1919;01 ] = [1184 184]
2 02532

Luego con un -valor mayor que 02, se acepta la hipótesis de igualdad de varianzas.
A la vista del test anterior, para comprobar la hipótesis inicial, se puede hacer un contraste
de la  para comparación de medias con varianzas desconocidas pero iguales. Así, calculamos
el estimador combinado de la desviación típica:
s r
(20 − 1)2 + (20 − 1)2 19 · 02342 + 19 · 02532
Pooled = = = 0244
20 + 20 − 2 38

15
y el estadístico de contraste será:

 −  0744 − 0496
= q = q = 3218
1 1 1 1
Pooled 20 + 20
0244 20 + 20

Como  = 3218  20+20−2;001 = 2428, se rechaza la hipótesis nula 0 y queda probado que
el filtrado con la resina A es mejor que el filtrado con la resina B.
b) Queremos tener una potencia del 90% para detectar la alternativa

| −  | | −  | 02
= '  = = 041
2 2Pooled 2 · 0244
Usando la carta VI(h) vemos que necesitamos ∗ ' 75 (ligeramente superior) submuestras
para tener la potencia deseada. Con 1 = 2 =  = 20 tenemos ∗ = 2 − 1 = 2 · 20 − 1 = 39
y nos quedamos cortos.
c) Ahora tenemos que realizar ahora el contraste
½
0 :  −  ≤ 02
1 :  −   02

Para realizar este contraste, usaremos

  −   − 02 0744 − 0496 − 02


= q = q = 0623
1 1 1 1
Pooled 20 + 20 0244 20 + 20

Dado que 38;04 ' 0253 y 38;025 ' 0679, obtenemos una acotación del -valor del con-
traste anterior entre [025 04] (exactamente, el -valor vale 0269). Consecuentemente, no
tenemos evidencia estadística para realizar esa afirmación respecto a la reducción de niveles
de impurezas.
d) Sea  =“Porcentaje de submuestras impuras usando filtro con resina A” y  =“Por-
centaje de submuestras impuras usando filtro con resina C”. Nos interesa el contraste:
½
0 :  −  ≤ 0
1 :  −   0

Los estimadores muestrales de las proporciones  y  son:


76 + 13 94 + 39
̂ = = 0665 y ̂ = = 0445
200 200
Usando estas proporciones obtenemos el estimador combinado ̂ = (̂1 + ̂2 )(1 + 2 ) =
(0445 + 0665)(200 + 200) = 0555 y el estadístico de contraste
̂ − ̂ 0665 − 0445
=r ³ ´=q ¡ 1 ¢ = 44269
1
̂(1 − ̂) 11 + 1 0555(1 − 0555) 200 + 200
2

Rechazaremos la hipótesis nula (y, por tanto, sí que se puede realizar la afirmación del
enunciado) dado que  = 44269  001 = 232.

16
Problema 7 a) Nos piden una cota superior al 95% para  . Dado que
µ ¶

  ≤  + −1; √ = 095


tenemos que 68 + 170 · 15 30 = 727 sería el valor de dicha cota.
En la segunda parte de este apartado nos piden establecer las hipótesis 0 y 1 tales que la
región de rechazo  = {  727} de lugar a un test de nivel 005 para esas hipótesis. Las
hipótesis que necesitamos son ½
0 :  ≤ 68

1 :   68
¡ √ ¢
Nótese que la región de rechazo verifica  = 005 =    0 + −1; ·    =
¡ √ ¢ ¡ ¢
   68 + 170 · 15 30 =    727 .
b) Dado que los vehículos con y sin innovaciones son probados por el mismo usuario, está
bastante claro que tratamos con datos de tipo “apareado”. Quedará probado que el índice
de satisfacción medio aumenta significativamente si se rechaza 0 para el contraste
½
0 :  ≤ 0

1 :   0

con  =  − . Vemos que

 19
= √ = √ = 4524  30−1;001 = 246
   23 30

y, por tanto, se rechaza 0 . Así, queda probada la afirmación del enunciado a nivel  = 001.
c) En este apartado usaremos la carta OC (h) (test  unilateral con  = 001). Deseamos
una potencia  = 09 ( = 1 − 09 = 01) para detectar la alternativa  = | |  '
| | = 0923 ' 04. Vemos que con  = 30 tenemos un  ' 055  01 y, por
tanto, ese tamaño muestral es insuficiente. Usando esta tabla, vemos que necesitamos entre
75    100 observaciones.
d) Ahora nos piden realizar el test
½
0 :  ≤ 15

1 :   15

Usamos el estadístico
 − 15 19 − 15
= √ = √ = 095
   23 30
Dado que 30−1;01 = 1311 y 30−1;025 = 0683, tenemos que el -valor de este contraste es
 [29  095] ∈ [01 025]. Con este -valor, lo razonable es aceptar 0 y concluimos que
no se puede afirmar que introducir innovaciones en el vehículo aumente significativamente el
índice de satisfacción medio en más de 15 puntos.
e) En el enunciado nos proponen realizar el test
½
0 :  = 7
1 :  6= 7

17
© ª
usando la región de rechazo  =  ∈  [6 75] . La probabilidad de error de tipo I será
¡ ¢ ¡ ¢
 = 0  ∈  [6 75] =  =7  ∈  [6 75]
³ ³√ ´ ³√ ´´
= 1− Φ 30(75 − 7)19 − Φ 30(6 − 7)19
= 1 − (Φ(144) − Φ(−288)) = 1 − (09251 − 0002) = 00769

La probabilidad de error de tipo II para la alternativa  = 75(6= 7) será


¡ ¢ ³√ ´ ³√ ´
(75) =  =75  ∈ [6 75] = Φ 30(75 − 75)19 − Φ 30(6 − 75)19
= Φ(0) − Φ(−432) = 05

18

También podría gustarte