Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Pruebas HIPOTESIS II H
Pruebas HIPOTESIS II H
2-1. Se requiere que la resistencia a la ruptura de una fibra sea de por lo menos 150 psi.
La experiencia pasada indica que la desviación estándar de la resistencia a la ruptura es
σ=3 psi. Se prueba una muestra aleatoria de cuatro ejemplares de prueba, y los resultados
son y1=145, y2=153, y3=150 y y4=147;
a) Enunciar las hipótesis que el lector considere que deberían probarse en este
experimento.
b) Probar esta hipótesis utilizando α=0.05.
c) Encontrar el valor de p para la prueba.
d) Construir un intervalo de confianza del 95% para la resistencia a la ruptura promedio.
Solución:
Note que en este problema se conoce la varianza poblacional σ = 3 psi, asumiendo que la
resistencia a la ruptura de la fibra tiene una función de densidad de probabilidad normal
entonces por el teorema central del limite
x N ( ,
2
) N ( ,9 / 4) N ( ,2.25) Es decir en este caso se utiliza la estadística
n
n (x )
Z0 N (0,1)
a) La hipótesis más conveniente de acuerdo a lo que se pretende probar en este caso es la
siguiente:
H o : o vs H a : o
Esto debido a que se desea probar que la resistencia a la ruptura de la fibra es superior a
150 psi, con lo cual, el criterio es rechazar H 0 si: Z 0 Z , donde α, es el nivel de
significancia de la prueba, también se conoce como probabilidad de cometer el error tipo
I.
b) Prueba de la hipótesis
n ( x 0 ) 4 (148.75 150)
Estadísticas necesarias: y 148.75, Z0 0.833
3
Para α=0.05 se obtiene el valor de Z 0.05 1.6449
Al comparar el valor calculado de Z0 anterior se verifica que Z 0 0.833 1.6449 , por
lo tanto No se rechaza H0 y se concluye que los datos obtenidos de manera experimental
muestran evidencia significativa (α=0.05) de que la resistencia promedio a la ruptura de
la fibra es menor o igual a 150 psi.
c) Para obtener el valor de p se debe obtener el área bajo la curva desde el valor de z0 =-
0.833 hasta el infinito y gráficamente se tiene:
8.22 En un experimento (Science Vol. 87, No. 2252, feb 8, 1938), se determinó el
porcentaje de agua en 9 medusas (Aurelia sp). Los resultados se presentan en seguida:
El objetivo del experimento era probar la hipótesis, predominante entre los biólogos de la
época, de que el contenido de agua es de 99.8 %. Pruebe esa hipótesis con α=0.01.
Pasos a seguir:
I .C (95.9361,96.3973)
Los argumentos de la función TTEST son los siguientes y en el orden que se indica (x,
mu, alfa, tipo)
X, es el vector que contiene a los datos a los cuales se les aplicara la prueba de hipótesis
mu, es el valor de la media poblacional.
Alfa, denota el nivel de significancia de la prueba y el intervalo de confianza que se
obtendrá al aplicar la expresión (1-alfa)*100.
Tipo, indica de la hipótesis que se plantea en Ha por lo siguiente:
0, para la desigualdad de medias o prueba de dos colas.
1, para una prueba de cola superior
-1, para una prueba de cola inferior
Se puede ver que la salida del anterior programa es el siguiente con las indicaciones que
se dan:
media =
96.1667
s=
0.2062
LI =
95.9361
LS =
96.3972
h= 1 <- Indica 1 se rechaza Ho, mientras que un valor de 0 no se rechaza Ho
stats =
tstat: -52.8728 <- Valor de t0
df: 8 <- Grados de Libertad
> x<-c(95.9, 96.0, 96.6, 96.0, 96.2, 96.2, 96.3, 96.2, 96.1)
> summary(x)
Min. 1st Qu. Median Mean 3rd Qu. Max.
95.90 96.00 96.20 96.17 96.20 96.60
> media=mean(x)
> varianza=var(x)
> S=sqrt(varianza)
> media
[1] 96.16667
>S
[1] 0.2061553
> LI=media+qt(0.005, 8, lower.tail = TRUE, log.p = FALSE)*S/sqrt(9)
> valor_t=qt(0.005,8, lower.tail = TRUE, log.p = FALSE)
> valor_t
[1] -3.355387
> LI
[1] 95.93609
> LS=media-qt(0.005, 8, lower.tail = TRUE, log.p = FALSE)*S/sqrt(9)
> LS
[1] 96.39724
> t.test(x,y=NULL,alternative="two.sided",mu=99.8,conf.level=0.99)
data: x
t = -52.8728, df = 8, p-value = 1.815e-11
alternative hypothesis: true mean is not equal to 99.8
99 percent confidence interval:
95.93609 96.39724
sample estimates:
mean of x
96.16667
8.24 En una planta que se cultiva comercialmente se sabe (de registros existentes) que el
número de días a la floración es 80. Se ha desarrollado un compuesto químico que se
supone acelera el proceso. En un experimento se siembran 20 lotes aplicando el
compuesto. El número promedio de días a la floración en el experimento es de 75.8, con
una desviación estándar de 6.2 días. ¿Es suficiente esta evidencia para concluir que el
compuesto reduce la media de los días a la floración?. Use α=0.005.
Pasos a seguir:
a.- Planteamiento de la hipótesis estadística
H o : o vs H a : o
I .C (71.8337,79.7663)
8.20 En las etiquetas de una marca de leche evaporada se afirma que esta contiene “no
menos de 850 U.I. (unidades internacionales) de vitamina D por litro”. Se realizan 15
determinaciones del contenido (por litro) de vitamina D y se obtienen los siguientes
resultados:
836, 849, 872, 861, 839, 826, 856, 862, 859, 862, 848, 839, 846, 870, 861
Pasos a seguir:
I .C (842.1711, 862.63)
x<-c(836, 849, 872, 861, 839, 826, 856, 862, 859, 862, 848, 839, 846, 870, 861)
summary(x)
media=mean(x)
varianza=var(x)
S=sqrt(varianza)
media
S
LI=media+qt(0.005, 14, lower.tail = TRUE, log.p = FALSE)*S/sqrt(15)
valor_t=qt(0.025,14, lower.tail = TRUE, log.p = FALSE)
valor_t
LI
LS=media-qt(0.005, 14, lower.tail = TRUE, log.p = FALSE)*S/sqrt(15)
LS
t.test(x,y=NULL,alternative="greater",mu=850,conf.level=0.99)
La salida del anterior programa es la siguiente:
> x<-c(836, 849, 872, 861, 839, 826, 856, 862, 859, 862, 848, 839, 846, 870, 861)
> summary(x)
Min. 1st Qu. Median Mean 3rd Qu. Max.
826.0 842.5 856.0 852.4 861.5 872.0
> media=mean(x)
> varianza=var(x)
> S=sqrt(varianza)
> media
[1] 852.4
>S
[1] 13.30843
> LI=media+qt(0.005, 14, lower.tail = TRUE, log.p = FALSE)*S/sqrt(15)
> valor_t=qt(0.025,14, lower.tail = TRUE, log.p = FALSE)
> valor_t
[1] -2.144787
> LI
[1] 842.1709
> LS=media-qt(0.005, 14, lower.tail = TRUE, log.p = FALSE)*S/sqrt(15)
> LS
[1] 862.6291
> t.test(x,y=NULL,alternative="greater",mu=850,conf.level=0.99)
Puede verse que la función t-student solo proporciona el limite inferior del intervalo que
se desea y note también como se altero el valor del intervalo que se requiere
originalmente al cambiar de 0.99 al 0.995, esto es debido al tipo de prueba de hipótesis
que se tiene en la alterna, para que se calcule el valor correcto se deben hacer los
siguientes modificaciones en la función t.test:
t.test(x,y=NULL,alternative="two.sided",mu=850,conf.level=0.99)
Donde el único dato que coincide con los valores correctos del problema es el intervalo
de confianza.
El valor de p-value puede verse que en este caso se obtiene por el área de la funcion t-
student desde el valor de t0=0.6984 al infinito con 14 grados de libertad, gráficamente se
tiene lo siguiente:
Cabe aclarar que al proporcionar el nivel de confianza de 0.995 la función t.test solo
proporciona el límite inferior, para obtener el mismo intervalo de confianza que el que se
calculo anteriormente. Es necesario cambiar la última línea por la siguiente:
t.test(x,y=NULL,alternative="two.sided",mu=850,conf.level=0.99)
Pruebe la hipótesis de que la desviación estándar del método es menor de 0.006. Use
α=0.01.
Pasos a seguir:
(n 1) * S x2 (15 1) * (0.001406) 2
Xo
2
0.76877
o2 0.006 2
(21 ),( n 1) (210.01),(151) 4.6604
Como X o 0.76877 4.6604 ( 0.99 ),(14 ) , por lo tanto se rechaza Ho
2 2
d.- Conclusión
(n 1) S x (n 1) S x2
2
P 2 2 2 1
,( n 1) 1 ,( n 1)
2 2
donde: si α=0.05, y se obtienen los valores de ji-cuadrada de la tabla D, página 618 del
libro de Infante y Zarate de Lara (1984), entonces:
2 ,( n 1)
02.05 ,(151)
02.025,14 26.1189 y 12 ,( n 1)
0.975,14 5.6287 ,
2 2 2
gráficamente se tiene lo siguiente:
14 * 0.001406 2
(n 1) S x
2
(n 1) S x2 14 * 0.001406 2
P 2 2 2 P
26.1189 2
0.95
,( n 1) 1 ,( n 1) 5.6287
2 2
P 0.000001 2 0.000005 0.95 ,al obtener la raíz cuadrada se obtiene el IC del
95% para la desviación estándar.
0.705,0.710,0.692,0.680,0.698,0.708,0.712,0.608,0.703,0.726,0.702,0.699
0.683,0.714, 0.720,0.708, 0.696,0.701, 0.697
H o : 2 (0.018) 2 vs H a : 2 (0.018) 2
b.- Datos y estadísticas necesarias:
x 0.698 s x 0.024556 n 19
(n 1) * s x2
Estadística de prueba: X o
2
o2
c.- Criterio de rechazo de Ho
Se rechaza Ho si X o ,( n1) .
2 2
(n 1) * S x2 (19 1) * (0.024556) 2
X
2
o 33.5
o2 0.018 2
2 ,( n1) (20.05),(191) 28.8693
Como X o 33.5 28.8693 ( 0.05),(18) , por lo tanto se rechaza Ho
2 2
d.- Conclusión
Los datos analizados en este experimento muestran evidencia significativa (α=0.05) de
que la modificación reciente en la maquinaria produce una desviación estándar en la
masa efectiva de las agujas para la reproducción de discos mayor a 0.018 y por lo tanto el
proceso está fuera de control.
(n 1) S x (n 1) S x2
2
P 2 2 2 1
,( n 1) 1 ,( n 1)
2 2
donde: si α=0.05, y se obtienen los valores de ji-cuadrada de la tabla D, página 618 del
libro de Infante y Zarate de Lara (1984), entonces:
2 ,( n 1)
02.05 ,(191)
02.025,18 31.5264 y 12 ,( n 1)
0.975,18 8.2307 ,
2 2 2
gráficamente se tiene lo siguiente:
(n 1) S 2
(n 1) S x2 18 * 0.0245562 18 * 0.0245562
P 2 x
2
2
P
2
0.95
,( n1) 1 ,( n1) 31.5264 8.2307
2 2
P 0.000344 2 0.001319 0.95 ,al obtener la raíz cuadrada se obtiene el IC del
95% para la desviación estándar.
x<-c(0.705, 0.710, 0.692, 0.680, 0.698, 0.708, 0.712, 0.608, 0.703, 0.726, 0.702, 0.699,
0.683, 0.714, 0.720, 0.708, 0.696, 0.701, 0.697)
media=mean(x)
varianza=var(x)
S=sqrt(varianza)
media
S
varianza
LI=(19-1)*varianza/qchisq(0.975,18)
valor_chi_975=qchisq(0.975,18)
valor_chi_975
LI
LS=(19-1)*varianza/qchisq(0.025,18)
valor_chi_025=qchisq(0.025,18)
valor_chi_025
LS
media
[1] 0.698
S
[1] 0.02455606
varianza
[1] 0.000603
LI=(19-1)*varianza/qchisq(0.975,18)
valor_chi_975=qchisq(0.975,18)
valor_chi_975
[1] 31.52638
LI
[1] 0.0003442831
LS=(19-1)*varianza/qchisq(0.025,18)
valor_chi_025=qchisq(0.025,18)
valor_chi_025
[1] 8.230746
LS
[1] 0.001318714
PRUEBAS DE HIPOTESIS SOBRE LAS MEDIAS DE DOS
POBLACIONES CON DISTRIBUCION NORMAL
1.- Una compañía armadora de automóviles grande trata de decidir si compra llantas de la marca
A o de la B para sus modelos nuevos. Se lleva a cabo un experimento, para ayudar a llegar a una
decisión, en el se usan 12 llantas de cada marca. Las llantas se usan hasta que se borra el dibujo
de la parte rodada y los resultados son:
Pasos a seguir:
a.- Planteamiento de la hipótesis estadística
H o : A B vs Ha : A B
Ahora se calcula un intervalo de confianza de nivel 95% para la diferencia en las medias
poblacionales de ambas llantas aplicando la siguiente expresión:
1 1
( x A x B ) t (n A nB 2) * S p *
2 n A nB
Como (1-α)*100=95% entonces α=0.05, con lo cual α/2=0.025, además como
n A nB 12 , por lo tanto t 0.05 (24 2) t 0.025 ( 22) 2.07387
2
1 1
(37,900 39,800) 2.07387 * 5514.53 * 1900 4668.9 , por lo que el
12 12
intervalo de confianza de nivel 95% para la diferencia de medias es finalmente:
(-6568.9,2768.9)
2.- La pintura para autopista se surte en dos colores: blanco y amarillo. El interés se centra en el
tiempo de secado de la pintura; se sospecha que la pintura de color amarillo se seca más
rápidamente que la de color blanco. Se obtienen mediciones de ambos tipos de pintura. Los
tiempos de secado (en minutos) son los siguientes:
H o : A2 B2 vs H a : A2 B2
Estadísticas:
Pintura Blanca Pintura Amarilla
x B 132.125 x A 115 .2
S B 11 .2813 S A 9.04065
nB 8 n A 10
S B2 11 .2813 2
Estadística de prueba: Fo 1.55711
S A2 9.04065 2
La regla de decisión es rechazar Ho si F0 F1(nB ,1()n 1) o Fo F( nB,(n1)1)
2 A 2 A
1 1
Como F0.025,9 0.20734 F07.975,9 4.197
7
9
y
F
0.025, 7 4.823
Como Fo No pertenece a la región de rechazo de Ho por lo tanto no se rechaza y se
concluye que las varianzas de las dos poblaciones son iguales.
Cabe aclarar que el paquete R presenta la función var.test(y,x) la cual permite verificar la
condición de la varianzas poblacionales con las siguientes líneas:
data: y and x
F = 1.5571, num df = 7, denom df = 9, p-value = 0.5251
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.3710016 7.5102835
sample estimates:
ratio of variances
1.557111
1 1
( x A x B ) t (n A nB 2) * S p *
2 n A nB
(-25.27,-8.57)
Para que R lleve a cabo el cálculo del anterior intervalo, así como los valores necesario
para la prueba de hipótesis es la siguiente línea:
t.test(x,y,var.equal=T,alternative="less",conf.level=0.90)
data: x and y
t = -3.5389, df = 16, p-value = 0.0013649
alternative hypothesis: true difference is less than 0 //Checar
90 percent confidence interval:
-25.274688 -8.575312
sample estimates:
mean of x mean of y
115.200 132.125
3.- Los siguientes son datos de tiempos de combustión expresados en segundos de dos
diferentes posiciones de una marca de cerillos
Vertical Horizontal
20.3 30.5
21.5 21.2
23.5 25.7
20.3 18.5
20.7 34.6
21.6 12.5
22.5 21.5
20.9 26.5
20.5 28.6
22.5
45.7