Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Hoja de Ejercicios 6.
n1 = 13, x1 = 4, s1 = 3
n2 = 11, x2 = 5, s2 = 2.2
Suponiendo que el tiempo de desarrollo en la población Ai sigue una distribución N (µi , σi ), para
i = 1, 2, se pide:
1
a) Hallar un intervalo de confianza para el cociente de varianzas al nivel 0.80.
b) Obtener un intervalo de confianza para µ1 − µ2 , con nivel de confianza 0.95 (suponiendo
igualdad de varianzas).
c) ¿Cuántos individuos habrı́a que observar para estimar µ1 con un error máximo de ±0.2 y un
nivel de confianza de 0.95?
3. Contrastes
9. Se considera la variable que representa la temperatura corporal en los lagartos del desierto. El nivel
letal de esta variable es de 45o C. Se ha observado que la mayor parte de estos animales se oculta del
calor en verano para evitar aproximarse a este nivel letal. Se realiza un experimento para estudiar
la variable X, que es el tiempo en minutos que se requiere para que la temperatura del cuerpo de
un lagarto del desierto alcance los 45o C, partiendo de la temperatura normal de su cuerpo mientras
está a la sombra. Se obtuvieron estos datos:
10.1, 12.5, 12.2, 10.2, 12.8, 12.1, 11.2, 11.4, 10.7, 14.9, 13.9, 13.3
Considerando un nivel de significación del 5 %, ¿avalan los datos la hipótesis de que la radiación
media, en las proximidades del transmisor, es efectivamente de 10?
11. Un fabricante garantiza a un laboratorio farmacéutico que sus máquinas producen comprimidos con
un diámetro medio de 13 mm y una desviación tı́pica de 0.6 mm. Una muestra de 100 unidades dio
como media de los diámetros 13.12 mm. ¿Cabe esperar, a partir de este dato, que el fabricante dice
la verdad, a un nivel de significación del 5 %?
12. Un cierto medicamento alivia cierta dolencia en el 60 % de los casos. Se toma una muestra de 144
personas que sufren esa dolencia y se les hace tomar un nuevo medicamento encontrando alivio
100 de ellas. ¿Se puede afirmar al nivel del 5 % que el nuevo medicamento es más efectivo que el
antiguo?
13. El fichero cap01-DatosAlumnos.csv del primer capı́tulo del curso contiene datos de los alumnos de
una clase. Queremos saber si esos datos permiten afirmar que la altura media de los hombres es
superior a la de las mujeres. Contrasta esa afirmación al 95 %.
14. Se realizó un estudio para comparar las velocidades de difusión del dióxido de carbono a través de
suelos de porosidades diferentes. Para ello, se recogieron datos sobre esta velocidad en 13 muestras
de suelo fino, y 10 de suelo poroso. En las primeras se registró una velocidad media de 23.15, y
una desviación tı́pica de 2.82. En las segundas, se obtuvo una media de 26.3 y una desviación
tı́pica de 7.09. Asumiendo normalidad en ambos tipos de suelo, indı́quese si las velocidades pueden
considerarse diferentes al nivel de significación del 5 %.
15. Se efectúa un estudio sobre el color de los escarabajos tigre para conseguir pruebas que apoyen el
argumento de que la proporción de escarabajos negros puede variar de un lugar a otro. En una
muestra de 500 escarabajos capturados en una extensión próxima a Providence, Rhode Island, 95
eran negros. Una captura de 112 escarabajos en Aqueduct, Nueva York, contenı́a 17 individuos
negros. ¿Se puede concluir, a partir de estos datos, que hay diferencia entre las dos proporciones, a
un nivel de confianza del 99 %?
16. Un microbiólogo quiere obtener placas para preparaciones microscópicas de espesor uniforme. Un
proveedor afirma que sus placas tienen una varianza menor de 0.0158 micron2. Utilizando un
micrómetro sensible, el laboratorio toma al azar una muestra de 30 placas con una varianza mues-
tral resultante de 0.0213 micron2. ¿Es compatible con dicho resultado la pretensión del proveedor
a un nivel de significación del 10 %?
2
17. El contenido medio en proteı́nas del tejido muscular estriado en un análisis de 25 animales de cierta
raza de ganado vacuno es de 14 g. por cada 100 g. de tejido, con una desviación tı́pica de 2 g,
mientras que para el mismo número de animales de otra raza es de 14.5 g. con una desviación
tı́pica de 3g. Comprobar si las varianzas son iguales con una confianza del 95 %, suponiendo que la
distribución del contenido en proteı́nas es aproximadamente normal en ambos casos.
18. Los datos de temperatura recogidos en 1000 estaciones meteorológicas terrestres y marı́timas de
todo el mundo dieron una temperatura media de 57o F en 1950. En 1988, la temperatura media en
esas mismas estaciones fue de 57.6o F. Emparejando las lecturas de 1988 y 1950 en cada estación
meteorológica se estima que la desviación tı́pica de la diferencia de las lecturas es de 4.1o F. ¿Sos-
tienen estos datos, con un nivel de confianza del 95 %, el argumento de que la temperatura media
en 1988 fue superior que en 1950?
19. La concentración media de dióxido de carbono en el aire es de 0.035 (en porcentaje). Se piensa que
inmediatamente por encima del suelo, dicha concentración es mayor. Para contrastar esta suposición,
se analizaron 144 muestras de aire seleccionadas aleatoriamente y tomadas a la distancia de un pie
del suelo. Resultó una media muestral de 0.09 y una desviación tı́pica muestral de 0.25. ¿Avalan
estos datos, con un nivel de confianza del 99 %, la suposición anterior?
20. Una muestra de 200 bombillas de la marca A dio una vida media de funcionamiento de 2280 horas,
con desviación tı́pica de 80 horas. Otra muestra de 180 bombillas de la marca B dio de vida media
2320 horas, con desviación tı́pica de 100 horas. ¿Se puede afirmar, al 10 % de significación, que es
mayor la duración de las bombillas de la marca B?
21. La grave sequı́a de 1987 afectó tanto a la tasa de mortalidad de las plantas de vivero como a la
tasa de crecimiento de los árboles ya establecidos. Se piensa que la mayor parte de los árboles
de las zonas afectadas tienen un anillo de crecimiento de 1987 menor a la mitad de los anillos de
crecimiento de los demás. Una muestra de 250 árboles ha dado 150 con esta caracterı́stica. ¿Apoyan
los datos esta idea, a un nivel de significación del 5 %?
22. Se hizo un muestreo en dos municipios para averiguar su opinión sobre la fluoración del agua antes
de iniciar la campaña. Los resultados de estas encuestas fueron:
En el municipio 1, se realizó un muestreo sobre un total de 110 personas; el 52 % de ellas se
mostraron favorables a la campaña.
En el municipio 2, el tamaño de la muestra considerada fue de 75; el 55 % de ellas se mostraron
favorables a la campaña.
¿Puede aceptarse, al 95 % de confianza, que el porcentaje de partidarios de la fluoración era el
mismo en ambos municipios?
23. En las aguas en las que se practica la recogida de la almeja, el número máximo aceptable de
bacterias por cm3 es 70. Un valor medio superior a 70 puede ser peligroso (hay riesgo de contraer
hepatitis). Un grupo de cientı́ficos mide el número de bacterias en una muestra aleatoria de tamaño
9, obteniendo una media de 71.67 y una desviación tı́pica de 2.35. ¿Se puede afirmar, con una
confianza del 95 %, que las aguas son realmente peligrosas?
24. Una empresa propone al director de una fábrica un nuevo método que, supuestamente, reduce el
tiempo empleado en el montaje de uno de sus productos. Con el propósito de comparar tal método
con el empleado habitualmente, seleccionó aleatoriamente a cinco empleados para que llevasen a
cabo el montaje con los dos sistemas, y anotó los tiempos empleados en el montaje, obteniendo los
siguientes resultados:
Método habitual 38 32 41 35 32
Método nuevo 30 32 34 37 26
¿Se puede afirmar, con una confianza del 95 %, que el nuevo método reduce significativamente el
tiempo de montaje?
3
Respuestas
1. Tenemos n = 100, p̂ = 1/10 y q̂ = 9/10, por lo que se cumplen las condiciones n > 30, np̂ > 5 y
nq̂ > 5. Ası́ que nuestro intervalo de confianza vendrá dado por
3 3
1/10 − 1.96 , 1/10 + 1.96 = (0.0412, 0.1588).
100 100
Para la segunda parte, hay que tener en cuenta que el error máximo vendrá dado por la distancia
entre un extremo del intervalo y su centro, p̂. Esta cantidad es
r r
p·q 0.9 · 0.1
1.96 = 1.96 ≤ 0.01.
n n
Despejando n se tiene que n ≥ 3457.44, por lo que son necesarias n = 3458 personas.
2. Las condiciones n > 30, np̂ > 5 y nq̂ > 5 se cumplen claramente con n = 1000, p̂ = 556/1000 y
q̂ = 444/1000. Un error del ±3 % vendrı́a determinado cuando
r
p̂q̂ 3
zα/2 < .
n 100
De aquı́ que zα/2 = 1.90928, de donde concluimos que α = 0.9719.
3. El intervalo vendrá dado por
s s
55 45 55 45
55 55
− 1.96 100 100 , ( + 1.96 100 100 = (0.4524, 0.6475)
100 100 100 100
4
> xbar1=mean(muestra1)
> xbar2=mean(muestra2)
> sd1=sd(muestra1)
> sd2=sd(muestra2)
> leftci=xbar1-xbar2-zalphamedios*(((sd1^2)/300+(sd2^2)/400)^0.5)
> rightci=xbar1-xbar2+zalphamedios*(((sd1^2)/300+(sd2^2)/400)^0.5)
> leftci
[1] -6.347685
> rightci
[1] -5.367315
> prop.test(x=100,n=144,p=0.6,alternative="greater",conf.level=0.95,correct=FALSE)
5
0.6282 1.0000
sample estimates:
p
0.6944444
Como puede verse, el p-valor es aproximadamente 0.01035 y nos permite rechazar la hipótesis nula.
13. La afirmación es cierta al 95 %.
14. Varianzas diferentes y medias iguales al 95 %.
15. No hay diferencia entre las proporciones al 99 %.
0.09 − 0.035
Estadistico = ≈ 2.64
0.25
√
144
p-valor=0.004145301
20. Usando el fichero: Tut09-Contraste-2Pob-DifMedias-UsandoZ, tipo contrraste 2
Estadistico −4.274823. El p-Valor es 9.564 · · · 10−06
21. Es un contraste de proporciones, con p0 = 0.5 (la mayor parte se refiere a la mayorı́a, más de la
mitad. Se podrı́a fijar un valor más alto si se desea una mayoria cualificada, como tres cuartas
partes, pero en cualquier caso, debe ser al menos el 50 %). El tamaño de la muestra es n = 250 y la
150
proporción muestral es p̂ = . Vamos a contrastar la hipótesis alternativa Ha = {p > p0 }.
250
Usamos Wolfram Alpha, escribiendo test for binomial parameter , y cuando se abre el cua-
dro de diálogo en el que hay que introducir los datos, seleccionamos Use number of successes
150
instead (aunque se puede usar el primero poniendo como proporción 250 ). Luego tecleamos los
−4
datos, como se ve en la figura, y obtenemos un p-valor igual a 6.065 × 10 , con el que rechazamos
la hipótesis nula.
6
22. Es un contraste de igualdad de proporciones, en el que contrastamos la hipótesis nula:
H0 = {p1 = p2 }.
Vamos a usar también Wolfram Alpha, escribiendo: two proportion hypothesis test, e intro-
duciendo los datos de este problema como se muestra en la figura:
Asegúrate de marcar la opción two-tailed test tras terminar de introducir los datos, por defecto
se calcula un contraste unilateral. El p-valor resultante es 0.6877, ası́ que rechazamos Ha .
23. Contraste sobre la media, muestra pequeña. Usamos µ0 = 70. Contrastamos la hipótesis alternativa
es Ha = {µ > µ0 }.
Con el fichero
Tut07-Contraste-Media-UsandoT.R
del Tutorial07 (adjunto aquı́ con los datos del problema) obtenemos un p-valor, aproximadamente
igual a 0.03280 < 0.05. Rechazamos la hipótesis nula, y concluimos que las aguas son peligrosas.
Fı́jate en que, en un problema como este, la hipótesis “conservadora” H0 supone no dar la alarma
ante unas aguas potencialmente peligrosas. En este caso nos preocupa más cometer un error de tipo
7
II (falso negativo: “no pasa nada, las aguas son seguras”), que un error de tipo I (falso positivo,
falsa alarma). Ası́ que a diferencia de lo que hemos recomendado en otros ejercicios, aquı́ harı́amos
saltar la alarma con un p-valor sólo ligeramente inferior a 0.05.
24. Vamos a hacer este ejercicio suponiendo, incialmente, que los cinco empleados que usan el método
antigup, y los cinco que usan el método nuevo, se han elegido en muestras independientes. En
realidad, se trata de un ejercicio de contrastes emparejados, que no hemos visto en clase, de los
que puedes ver otro ejemplo en el examen de Enero del curso 2012-2013 del Grado en Biologı́a
(disponible en www2.uah.es/fsegundo)
Es un contraste de diferencia de medias, con muestras pequeñas. Como no sabemos nada sobre
la posible igualdad de las varianzas, tenemos necesariamente que hacer un contraste de varianzas.
Vamos a resolverlo usando las funciones var.test y t.test que se describen en el Tutorial09. El
código que usamos para el contraste de la hipótesis nula
H0 = {σ12 = σ22 }
(sobre la igualdad de las varianzas) es este:
> muestra1 = c(38, 32, 41, 35, 32)
> muestra2 = c(30, 32, 34, 37, 26)
> var.test(muestra1,muestra2,alternative="two.sided",conf.level=0.95)
data: muestra1 and muestra2 F = 0.8895, num df = 4, denom df = 4, p-value = 0.9124 alternative
hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval:
0.09261618 8.54356437
sample estimates:
ratio of variances
0.8895349
y como el p-valor es muy alto, no rechazamos la hipótesis nula. Eso significa que asumimos que las
varianzas son iguales.
Ahora vamos a hacer el contraste de medias, con hipótesis alternativa
Ha = {µ1 > µ2 }
porque suponemos que µ1 , el tiempo medio usando el método antiguo, es menor que µ2 el tiempo
medio por el método nuevo. Podemos usar t.test ası́:
> t.test(muestra1,muestra2,alternative="greater",conf.level=0.95,var.equal=TRUE)