Está en la página 1de 20

PRUEBAS DE HIPOTESIS SOBRE LA MEDIA POBLACIONAL   

DE UNA POBLACION CON DISTRIBUCION NORMAL

2-1. Se requiere que la resistencia a la ruptura de una fibra sea de por lo menos 150 psi.
La experiencia pasada indica que la desviación estándar de la resistencia a la ruptura es
σ=3 psi. Se prueba una muestra aleatoria de cuatro ejemplares de prueba, y los resultados
son y1=145, y2=153, y3=150 y y4=147;

a) Enunciar las hipótesis que el lector considere que deberían probarse en este
experimento.
b) Probar esta hipótesis utilizando α=0.05.
c) Encontrar el valor de p para la prueba.
d) Construir un intervalo de confianza del 95% para la resistencia a la ruptura promedio.

Solución:

Note que en este problema se conoce la varianza poblacional σ = 3 psi, asumiendo que la
resistencia a la ruptura de la fibra tiene una función de densidad de probabilidad normal
entonces por el teorema central del limite

x  N ( , 
2
)  N ( ,9 / 4)  N ( ,2.25) Es decir en este caso se utiliza la estadística
n
n (x  )
Z0   N (0,1)

a) La hipótesis más conveniente de acuerdo a lo que se pretende probar en este caso es la
siguiente:
H o :   o vs H a :   o
Esto debido a que se desea probar que la resistencia a la ruptura de la fibra es superior a
150 psi, con lo cual, el criterio es rechazar H 0 si: Z 0  Z , donde α, es el nivel de
significancia de la prueba, también se conoce como probabilidad de cometer el error tipo
I.

b) Prueba de la hipótesis

n ( x  0 ) 4 (148.75  150)
Estadísticas necesarias: y  148.75, Z0    0.833
 3
Para α=0.05 se obtiene el valor de Z 0.05  1.6449
Al comparar el valor calculado de Z0 anterior se verifica que Z 0  0.833  1.6449 , por
lo tanto No se rechaza H0 y se concluye que los datos obtenidos de manera experimental
muestran evidencia significativa (α=0.05) de que la resistencia promedio a la ruptura de
la fibra es menor o igual a 150 psi.

c) Para obtener el valor de p se debe obtener el área bajo la curva desde el valor de z0 =-
0.833 hasta el infinito y gráficamente se tiene:

Claramente el valor de p=0.7976 es decir el valor de significancia observado es de 0.7976


y es superior al valor de α=0.05, por lo tanto basado en el valor p-value o nivel de
significancia observado no se rechaza H0 esto debido a que: p _ value   .

c) Para obtener el intervalo de confianza de nivel (1-α)*100 para el valor promedio de la


resistencia a la ruptura de la fibra se aplica la siguiente expresión:
x  Z *  / n  148.75  Z 2 * 3
2 4
Para obtener el valor de Z 2 , se hace referencia al nivel de confianza que se pide en el
problema, que en este caso es de 95% (es decir (1-α)*100=95% ) de donde el valor de
α=0.05, con lo cual α/2=0.025, por lo tanto el valor que se requiere es:
Z  Z 0.05  Z 0.025  1.96 , por lo tanto se tiene que
2 2

x  Z *  / n  148.75  1.96 * 3  148.75  2.94


2 2
De donde el intervalo de confianza al nivel del 95% para la media solicitado es:

(145.81, 151.69), gráficamente se tiene:

8.22 En un experimento (Science Vol. 87, No. 2252, feb 8, 1938), se determinó el
porcentaje de agua en 9 medusas (Aurelia sp). Los resultados se presentan en seguida:

95.9, 96.0, 96.6, 96.0, 96.2, 96.2, 96.3, 96.2, 96.1

El objetivo del experimento era probar la hipótesis, predominante entre los biólogos de la
época, de que el contenido de agua es de 99.8 %. Pruebe esa hipótesis con α=0.01.

Pasos a seguir:

a.- Planteamiento de la hipótesis estadística


H o :   o vs H a :   o

donde  o  99.8 , por lo que se transforma en lo siguiente:


H o :   99.8 vs H a :   99.8

b.- Datos y estadísticas necesarias:


x  96.1667 s x  0.206155 n9
n * (x  o )
Estadística de prueba: t o 
sx
c.- Criterio de rechazo de Ho
Se rechaza Ho si t o  t 2 (n  1) .
n * (x  o ) 9 * (96.1667  99.8)
to    52.8728   52.8728  52.8728
sx 0.206155
t 0.01 (9  1)  t 0.005 (8)  3.35539
2
Como t o  52.8728  3.35539  t 0.005 (8) , por lo tanto se Rechaza Ho
d.- Conclusión

Los datos analizados en este experimento muestran evidencia altamente significativa


(α=0.01) de que la media poblacional del contenido de agua expresado en porcentaje de
agua es estadísticamente diferente de 99.8 de hecho es inferior.

Un intervalo de confianza para μ del 99% es el siguiente:

x  t (n  1) * s x / n  96.1667  3.35539 * 0.206155 / 9  96.1667  0.230577


2

I .C  (95.9361,96.3973)

El listado del programa escrito en MATLAB se muestra a continuación:

x = [95.9, 96.0, 96.6, 96.0,96.2, 96.2, 96.3, 96.2, 96.1];


media=mean(x)
s=std(x)
LI=media-tinv(0.995,8)*s/sqrt(9)
LS=media+tinv(0.995,8)*s/sqrt(9)
[h,sig,ci,stats] = TTEST(x, 99.8, 0.01, 0)

Los argumentos de la función TTEST son los siguientes y en el orden que se indica (x,
mu, alfa, tipo)

X, es el vector que contiene a los datos a los cuales se les aplicara la prueba de hipótesis
mu, es el valor de la media poblacional.
Alfa, denota el nivel de significancia de la prueba y el intervalo de confianza que se
obtendrá al aplicar la expresión (1-alfa)*100.
Tipo, indica de la hipótesis que se plantea en Ha por lo siguiente:
0, para la desigualdad de medias o prueba de dos colas.
1, para una prueba de cola superior
-1, para una prueba de cola inferior

Se puede ver que la salida del anterior programa es el siguiente con las indicaciones que
se dan:
media =
96.1667
s=
0.2062
LI =
95.9361
LS =
96.3972
h= 1 <- Indica 1 se rechaza Ho, mientras que un valor de 0 no se rechaza Ho

sig = 1.8151e-011 <- Nivel de significancia observado o p-value

ci = 95.9361 96.3972 <- Intervalo de confianza de nivel (1-0.01)*100= 99%

stats =
tstat: -52.8728 <- Valor de t0
df: 8 <- Grados de Libertad

Pueden compararse los resultados obtenidos con la aplicación de la función TTEST de


MATLAB con los obtenidos de manera manual previamente.

Ahora se muestra el programa escrito en R para resolver el mismo problema:

x<-c(95.9, 96.0, 96.6, 96.0, 96.2, 96.2, 96.3, 96.2, 96.1)


summary(x)
media=mean(x)
varianza=var(x)
S=sqrt(varianza)
media
S
LI=media+qt(0.005, 8, lower.tail = TRUE, log.p = FALSE)*S/sqrt(9)
valor_t=qt(0.005,8, lower.tail = TRUE, log.p = FALSE)
valor_t
LI
LS=media-qt(0.005, 8, lower.tail = TRUE, log.p = FALSE)*S/sqrt(9)
LS
t.test(x,y=NULL,alternative="two.sided",mu=99.8,conf.level=0.99)
La salida del anterior programa es la siguiente:

> x<-c(95.9, 96.0, 96.6, 96.0, 96.2, 96.2, 96.3, 96.2, 96.1)
> summary(x)
Min. 1st Qu. Median Mean 3rd Qu. Max.
95.90 96.00 96.20 96.17 96.20 96.60
> media=mean(x)
> varianza=var(x)
> S=sqrt(varianza)
> media
[1] 96.16667
>S
[1] 0.2061553
> LI=media+qt(0.005, 8, lower.tail = TRUE, log.p = FALSE)*S/sqrt(9)
> valor_t=qt(0.005,8, lower.tail = TRUE, log.p = FALSE)
> valor_t
[1] -3.355387
> LI
[1] 95.93609
> LS=media-qt(0.005, 8, lower.tail = TRUE, log.p = FALSE)*S/sqrt(9)
> LS
[1] 96.39724
> t.test(x,y=NULL,alternative="two.sided",mu=99.8,conf.level=0.99)

One Sample t-test

data: x
t = -52.8728, df = 8, p-value = 1.815e-11
alternative hypothesis: true mean is not equal to 99.8
99 percent confidence interval:
95.93609 96.39724
sample estimates:
mean of x
96.16667

8.24 En una planta que se cultiva comercialmente se sabe (de registros existentes) que el
número de días a la floración es 80. Se ha desarrollado un compuesto químico que se
supone acelera el proceso. En un experimento se siembran 20 lotes aplicando el
compuesto. El número promedio de días a la floración en el experimento es de 75.8, con
una desviación estándar de 6.2 días. ¿Es suficiente esta evidencia para concluir que el
compuesto reduce la media de los días a la floración?. Use α=0.005.

Pasos a seguir:
a.- Planteamiento de la hipótesis estadística
H o :    o vs H a :   o

donde  o  80 , por lo que se transforma en lo siguiente:


H o :   80 vs H a :   80

b.- Datos y estadísticas necesarias:


x  75.8 s x  6.2 n  20
n * (x  o )
Estadística de prueba: t o 
sx
c.- Criterio de rechazo de Ho
Se rechaza Ho si t o  t (n  1) .
n * (x  o ) 20 * (75.8  80)
to    3.02951
sx 6.2
t 0.005 (20  1)  t 0.005 (19)  2.86093
Como t o  3.02951  2.86093  t 0.005 (19) , por lo tanto se Rechaza Ho
d.- Conclusión

Los datos analizados en este experimento muestran evidencia altamente significativa


(α=0.005) de que el producto químico en promedio reduce el número de días a la
floración del cultivo.

Un intervalo de confianza para μ del 99% es el siguiente:

x  t (n  1) * s x / n  75.8  2.86093 * 6.2 / 20  75.8  3.96629


2

I .C  (71.8337,79.7663)

8.20 En las etiquetas de una marca de leche evaporada se afirma que esta contiene “no
menos de 850 U.I. (unidades internacionales) de vitamina D por litro”. Se realizan 15
determinaciones del contenido (por litro) de vitamina D y se obtienen los siguientes
resultados:

836, 849, 872, 861, 839, 826, 856, 862, 859, 862, 848, 839, 846, 870, 861

Pruebe la hipótesis del fabricante con α=0.025. ¿Cuál es el nivel observado de


significancia de la muestra?.

Pasos a seguir:

a.- Planteamiento de la hipótesis estadística


H o :    o vs H a :   o
donde  o  850 , por lo que se transforma en lo siguiente:
H o :   850 vs H a :   850

b.- Datos y estadísticas necesarias:


x  852.4 s x  13.3084 n  15
n * (x  o )
Estadística de prueba: t o 
sx
c.- Criterio de rechazo de Ho Se rechaza Ho si t o  t (n  1) .
n * (x  o ) 15 * (852.4  850)
to    0.698443
sx 13.3084
t 0.025 (15  1)  t 0.025 (14)  2.14479
Como t o  0.698443  2.14479  t 0.025 (14) , por lo tanto No se Rechaza Ho
d.- Conclusión

Los datos analizados en este experimento muestran evidencia significativa (α=0.025) de


que el contenido promedio de vitamina D en la leche es menor de 850 U.I.

Un intervalo de confianza para μ del 99% es el siguiente:

En este caso (1-α)*100=99% por lo tanto α=0.01, de donde α/2=0.01/2=0.005, por lo


tanto para calcular el IC del 99% se requiere obtener el valor de t 0.005 (14)  2.9768

x  t (n  1) * s x / n  852.4  2.9768 *13.3084 / 15  852.4  10.2289


2

I .C  (842.1711, 862.63)

A continuación se muestra el programa en R que permite obtener la prueba de t para los


datos del ejemplo.

x<-c(836, 849, 872, 861, 839, 826, 856, 862, 859, 862, 848, 839, 846, 870, 861)
summary(x)
media=mean(x)
varianza=var(x)
S=sqrt(varianza)
media
S
LI=media+qt(0.005, 14, lower.tail = TRUE, log.p = FALSE)*S/sqrt(15)
valor_t=qt(0.025,14, lower.tail = TRUE, log.p = FALSE)
valor_t
LI
LS=media-qt(0.005, 14, lower.tail = TRUE, log.p = FALSE)*S/sqrt(15)
LS
t.test(x,y=NULL,alternative="greater",mu=850,conf.level=0.99)
La salida del anterior programa es la siguiente:

> x<-c(836, 849, 872, 861, 839, 826, 856, 862, 859, 862, 848, 839, 846, 870, 861)
> summary(x)
Min. 1st Qu. Median Mean 3rd Qu. Max.
826.0 842.5 856.0 852.4 861.5 872.0
> media=mean(x)
> varianza=var(x)
> S=sqrt(varianza)
> media
[1] 852.4
>S
[1] 13.30843
> LI=media+qt(0.005, 14, lower.tail = TRUE, log.p = FALSE)*S/sqrt(15)
> valor_t=qt(0.025,14, lower.tail = TRUE, log.p = FALSE)
> valor_t
[1] -2.144787
> LI
[1] 842.1709
> LS=media-qt(0.005, 14, lower.tail = TRUE, log.p = FALSE)*S/sqrt(15)
> LS
[1] 862.6291
> t.test(x,y=NULL,alternative="greater",mu=850,conf.level=0.99)

One Sample t-test


data: x
t = 0.6984, df = 14, p-value = 0.2482
alternative hypothesis: true mean is greater than 850
99.5 percent confidence interval:
842.1709 Inf
sample estimates:
mean of x
852.4

Puede verse que la función t-student solo proporciona el limite inferior del intervalo que
se desea y note también como se altero el valor del intervalo que se requiere
originalmente al cambiar de 0.99 al 0.995, esto es debido al tipo de prueba de hipótesis
que se tiene en la alterna, para que se calcule el valor correcto se deben hacer los
siguientes modificaciones en la función t.test:

t.test(x,y=NULL,alternative="two.sided",mu=850,conf.level=0.99)

Donde el único dato que coincide con los valores correctos del problema es el intervalo
de confianza.
El valor de p-value puede verse que en este caso se obtiene por el área de la funcion t-
student desde el valor de t0=0.6984 al infinito con 14 grados de libertad, gráficamente se
tiene lo siguiente:

Al comparar el valor de p-value=0.2482 es mayor del valor de α=0.025, por lo tanto


basado en esto no se rechaza H0 y se obtiene la misma conclusión anterior.

Cabe aclarar que al proporcionar el nivel de confianza de 0.995 la función t.test solo
proporciona el límite inferior, para obtener el mismo intervalo de confianza que el que se
calculo anteriormente. Es necesario cambiar la última línea por la siguiente:

t.test(x,y=NULL,alternative="two.sided",mu=850,conf.level=0.99)

Donde el único dato que coincide es el del intervalo de confianza.

PRUEBAS DE HIPOTESIS SOBRE LA VARIANZA POBLACIONAL


( 2 ) DE UNA POBLACION CON DISTRIBUCION NORMAL
8.25 Para determinar el contenido de oxigeno en aire seco se utiliza una técnica
gravimétrica que se considera los suficientemente precisa si tiene una desviación estándar
menor de 0.006 (en porcentaje de volumen). En 15 determinaciones realizadas con el
método en la misma muestra se obtuvieron los siguientes resultados (en porcentaje por
volumen en aire seco).

20.9468, 20.9440, 20.9450, 20.9460, 20.9469, 20.9443, 20.9440, 20.9447,


20.9469, 20.9438, 20.9443, 20.9448, 20.9440, 20.9462, 20.9483

Pruebe la hipótesis de que la desviación estándar del método es menor de 0.006. Use
α=0.01.
Pasos a seguir:

a.- Planteamiento de la hipótesis estadística


H o :  2   o2 vs H a :  2   o2

donde  o  0.006 , por lo que se transforma en lo siguiente:


2 2
H o :  2  (0.006) 2 vs H a :  2  (0.006) 2
b.- Datos y estadísticas necesarias:
x  20.9453 s x  0.001406 n  15
(n  1) * s x2
Estadística de prueba: X 
2
o
 o2
c.- Criterio de rechazo de Ho
Se rechaza Ho si X o   (1 ),( n 1) .
2 2

(n  1) * S x2 (15  1) * (0.001406) 2
Xo 
2
  0.76877
 o2 0.006 2
 (21 ),( n 1)   (210.01),(151)  4.6604
Como X o  0.76877  4.6604   ( 0.99 ),(14 ) , por lo tanto se rechaza Ho
2 2

d.- Conclusión

Los datos analizados en este experimento muestran evidencia significativa (α=0.01) de


que la desviación estándar de la técnica gravimétrica es menor de 0.006

Un intervalo de confianza para σ2 del (1-α)*100% es el siguiente:

 
 (n  1) S x (n  1) S x2 
2
P 2 2  2  1
   ,( n 1)  1 ,( n 1) 
 2 2 
donde: si α=0.05, y se obtienen los valores de ji-cuadrada de la tabla D, página 618 del
libro de Infante y Zarate de Lara (1984), entonces:

 2 ,( n 1)
  02.05 ,(151)
  02.025,14  26.1189 y  12 ,( n 1)
  0.975,14  5.6287 ,
2 2 2
gráficamente se tiene lo siguiente:
   14 * 0.001406 2
 (n  1) S x
2
(n  1) S x2  14 * 0.001406 2 
P 2 2  2  P 
 26.1189   2
   0.95
   ,( n 1)  1 ,( n 1)   5.6287 
 2 2 

 
P 0.000001   2  0.000005  0.95 ,al obtener la raíz cuadrada se obtiene el IC del
95% para la desviación estándar.

P 0.001    0.002236  0.95

8.26 Una maquina para la fabricación de agujas para la reproducción de discos


fonográficos debe reproducir especimenes cuya masa efectiva (en la punta) sea de 0.7
mg. Suponga que la masa promedio es la correcta, pero se teme que una modificación
reciente en la maquinaria haya incrementado la varianza. El proceso de fabricación está
fuera de control si   0.018 . En una muestra de 19 agujas se determina la masa de cada
una obteniéndose los siguientes resultados (expresados en mg):

0.705,0.710,0.692,0.680,0.698,0.708,0.712,0.608,0.703,0.726,0.702,0.699
0.683,0.714, 0.720,0.708, 0.696,0.701, 0.697

Pruebe la hipótesis de que el proceso está fuera de control. Use α=0.05.


Pasos a seguir:

a.- Planteamiento de la hipótesis estadística


H o :  2   o2 vs H a :  2   o2

donde  o  0.018 , por lo que se transforma en lo siguiente:


2 2

H o :  2  (0.018) 2 vs H a :  2  (0.018) 2
b.- Datos y estadísticas necesarias:
x  0.698 s x  0.024556 n  19
(n  1) * s x2
Estadística de prueba: X o 
2

 o2
c.- Criterio de rechazo de Ho
Se rechaza Ho si X o    ,( n1) .
2 2

(n  1) * S x2 (19  1) * (0.024556) 2
X 
2
o   33.5
 o2 0.018 2
 2 ,( n1)   (20.05),(191)  28.8693
Como X o  33.5  28.8693   ( 0.05),(18) , por lo tanto se rechaza Ho
2 2

d.- Conclusión
Los datos analizados en este experimento muestran evidencia significativa (α=0.05) de
que la modificación reciente en la maquinaria produce una desviación estándar en la
masa efectiva de las agujas para la reproducción de discos mayor a 0.018 y por lo tanto el
proceso está fuera de control.

Para encontrar in IC del 95% para la σ2 aplicamos la siguiente expresión:

 
 (n  1) S x (n  1) S x2 
2
P 2 2  2  1
   ,( n 1)  1 ,( n 1) 
 2 2 

donde: si α=0.05, y se obtienen los valores de ji-cuadrada de la tabla D, página 618 del
libro de Infante y Zarate de Lara (1984), entonces:

2 ,( n 1)
  02.05 ,(191)
  02.025,18  31.5264 y 12 ,( n 1)
  0.975,18  8.2307 ,
2 2 2
gráficamente se tiene lo siguiente:

 (n  1) S 2
 (n  1) S x2   18 * 0.0245562 18 * 0.0245562 
P 2 x
  2
2
 P  
2
  0.95
   ,( n1) 1 ,( n1)   31.5264 8.2307 
 2 2 

 
P 0.000344   2  0.001319  0.95 ,al obtener la raíz cuadrada se obtiene el IC del
95% para la desviación estándar.

P  0.018555    0.036314  0.95

A continuación se muestra una porción de un programa escrito en MATLAB y R para


calcular el IC para la varianza
x = [0.705, 0.710, 0.692, 0.680, 0.698, 0.708, 0.712, 0.608, 0.703, 0.726, 0.702, 0.699,
0.683, 0.714, 0.720, 0.708, 0.696, 0.701, 0.697];
media=mean(x)
s=std(x)
varianza=var(x)
valor_ji_975=chi2inv(0.975,18)
valor_ji_025=chi2inv(0.025,18)
LI=(19-1)*varianza/chi2inv(0.975,18)
LS=(19-1)*varianza/chi2inv(0.025,18)

Que proporciona la siguiente salida:


media = 0.6980
s = 0.0246
varianza = 6.0300e-004
valor_ji_975 = 31.5264
valor_ji_025 = 8.2307
LI = 3.4428e-004
LS = 0.0013

En R se tiene el siguiente programa:

x<-c(0.705, 0.710, 0.692, 0.680, 0.698, 0.708, 0.712, 0.608, 0.703, 0.726, 0.702, 0.699,
0.683, 0.714, 0.720, 0.708, 0.696, 0.701, 0.697)
media=mean(x)
varianza=var(x)
S=sqrt(varianza)
media
S
varianza
LI=(19-1)*varianza/qchisq(0.975,18)
valor_chi_975=qchisq(0.975,18)
valor_chi_975
LI
LS=(19-1)*varianza/qchisq(0.025,18)
valor_chi_025=qchisq(0.025,18)
valor_chi_025
LS

En este caso la salida es la siguiente:

media
[1] 0.698
S
[1] 0.02455606
varianza
[1] 0.000603
LI=(19-1)*varianza/qchisq(0.975,18)
valor_chi_975=qchisq(0.975,18)
valor_chi_975
[1] 31.52638
LI
[1] 0.0003442831
LS=(19-1)*varianza/qchisq(0.025,18)
valor_chi_025=qchisq(0.025,18)
valor_chi_025
[1] 8.230746
LS
[1] 0.001318714
PRUEBAS DE HIPOTESIS SOBRE LAS MEDIAS DE DOS
POBLACIONES CON DISTRIBUCION NORMAL

1.- Una compañía armadora de automóviles grande trata de decidir si compra llantas de la marca
A o de la B para sus modelos nuevos. Se lleva a cabo un experimento, para ayudar a llegar a una
decisión, en el se usan 12 llantas de cada marca. Las llantas se usan hasta que se borra el dibujo
de la parte rodada y los resultados son:

Marca A: x A  37,900 km y s A  5,100 km


Marca B: xB  39,800 km y sB  5,900 km

Pruebe la hipótesis de que no hay diferencia en la duración promedio (expresado en kilómetros


rodados) de las dos marcas de llantas con un nivel de significancia de 0.05. Suponga que las
poblaciones se distribuyen de forma aproximadamente normal con varianzas iguales.

Pasos a seguir:
a.- Planteamiento de la hipótesis estadística
H o :  A   B vs Ha : A  B

b.- Datos y estadísticas necesarias:


Marca A: x A  37,900 km y s A  5,100 km n A  12
Marca B: xB  39,800 km y s B  5,900 km nB  12
( x A  xB )
to  (n A  1) * s A2  (n B  1) * s B2
Estadística de prueba: 1 s
1 donde p2

sp *  n A  nB  2
n A nB
c.- Criterio de rechazo de Ho
Se rechaza Ho si t o  t 2 (n A  n B  2) .
(n A  1) * s A2  (n B  1) * s B2 (12  1) * 5100 2  (12  1) * 5900 2
s 
2
p   3.041 * 10 7  s p  5514.53
n A  nB  2 12  12  2
( x A  xB ) (37900  39800)  1900
to     0.843958
1 1 2 2251.3
sp *  5514.53 *
n A nB 12

t 0.05 (24  2)  t 0.025 (22)  2.07387


2
Como t o  0.843958  2.07387  t 0.025 (22) , por lo tanto no se rechaza Ho
d.- Conclusión

Los datos analizados en este experimento muestran evidencia significativa (α=0.05) de no


existir diferencia en los tiempos promedio de duración de cada tipo de llanta, es decir los
datos experimentales obtenidos no permiten rechazar Ho al nivel de significancia de 0.05.

Ahora se calcula un intervalo de confianza de nivel 95% para la diferencia en las medias
poblacionales de ambas llantas aplicando la siguiente expresión:

1 1
( x A  x B )  t (n A  nB  2) * S p * 
2 n A nB
Como (1-α)*100=95% entonces α=0.05, con lo cual α/2=0.025, además como
n A  nB  12 , por lo tanto t 0.05 (24  2)  t 0.025 ( 22)  2.07387
2
1 1
(37,900  39,800)  2.07387 * 5514.53 *   1900  4668.9 , por lo que el
12 12
intervalo de confianza de nivel 95% para la diferencia de medias es finalmente:

(-6568.9,2768.9)

2.- La pintura para autopista se surte en dos colores: blanco y amarillo. El interés se centra en el
tiempo de secado de la pintura; se sospecha que la pintura de color amarillo se seca más
rápidamente que la de color blanco. Se obtienen mediciones de ambos tipos de pintura. Los
tiempos de secado (en minutos) son los siguientes:

Blanca: 120, 132, 139, 122, 147, 130, 120, 147.


Amarilla: 126, 120, 116, 125, 109, 103, 125, 117, 109, 102.
a).- Efectúe una hipótesis que permita evaluar si se tienen varianzas iguales. Use =0.05.
b).- Dependiendo del resultado obtenido en a) pruebe la hipótesis de que la pintura amarilla
tienen un menor tiempo de secado que la pintura blanca. Use =0.05. Suponga que el tiempo de
secado está distribuido de manera normal, en ambas pinturas y que las pruebas fueron
independientes.
Solución: Planteamiento de la hipótesis

H o :  A2   B2 vs H a :  A2   B2
Estadísticas:
Pintura Blanca Pintura Amarilla
x B  132.125 x A  115 .2
S B  11 .2813 S A  9.04065
nB  8 n A  10

S B2 11 .2813 2
Estadística de prueba: Fo    1.55711
S A2 9.04065 2
La regla de decisión es rechazar Ho si F0  F1(nB ,1()n 1) o Fo  F( nB,(n1)1)
2 A 2 A

1 1
Como F0.025,9    0.20734 F07.975,9  4.197
7
9
y
F
0.025, 7 4.823
Como Fo No pertenece a la región de rechazo de Ho por lo tanto no se rechaza y se
concluye que las varianzas de las dos poblaciones son iguales.

Cabe aclarar que el paquete R presenta la función var.test(y,x) la cual permite verificar la
condición de la varianzas poblacionales con las siguientes líneas:

y<-c(120, 132, 139, 122, 147, 130, 120, 147)


x<-c(126, 120, 116, 125, 109, 103, 125, 117, 109, 102)
summary(x)
summary(y)
mediax=mean(x)
mediay=mean(y)
varianzax=var(x)
varianzay=var(y)
Sx=sqrt(varianzax)
Sy=sqrt(varianzay)
mediax
mediay
Sx
Sy
var.test(y,x)

Dando la siguiente salida:


mediax
[1] 115.2
> mediay
[1] 132.125
> Sx
[1] 9.040649
> Sy
[1] 11.28131
> var.test(y,x)
F test to compare two variances

data: y and x
F = 1.5571, num df = 7, denom df = 9, p-value = 0.5251
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.3710016 7.5102835
sample estimates:
ratio of variances
1.557111

b).- Planteamiento de la hipótesis estadística:


Ho : A  B vs Ha : A  B
( x A  xB )
to  (n A  1) * s A2  (n B  1) * s B2
1 donde s p 
2
Estadística de prueba: 1
sp *  n A  nB  2
n A nB
9 * 9.04 2  7 * 11 .28152
s 2p   101.645 s p  10.082
10  8  2

(x A  xB ) (115 .2  132.125)  16.925


to     3.53908
1 1 1 1 4.78231
sp *  10.082 * 
n A nB 10 8
Se rechaza Ho si t o  t ,( n A  nB  2 )  t 0.05,16  1.74588

Como t o  3.53908  1.74588 , se rechaza Ho y se concluye que en promedio el


tiempo de secado de la pintura amarilla es menor a la de la pintura blanca con un nivel de
significancia de 0.05.

Ahora se obtiene un IC del 90% para la diferencia de las medias x A  x B empleando la


siguiente expresión

1 1
( x A  x B )  t (n A  nB  2) * S p * 
2 n A nB

Como (1-α)*100=90% entonces α=0.10, con lo cual α/2=0.05, además como


n A  10 y nB  8 , por lo tanto t 0.05 (10  8  2)  t 0.05 (16)  1.74588
1 1
(115 .2  132.125)  1.74588 *10.082 *   16.925  8.35 , por lo que el
10 8
intervalo de confianza de nivel 90% para la diferencia de medias es finalmente:

(-25.27,-8.57)
Para que R lleve a cabo el cálculo del anterior intervalo, así como los valores necesario
para la prueba de hipótesis es la siguiente línea:

t.test(x,y,var.equal=T,alternative="less",conf.level=0.90)

Misma que proporciona la siguiente salida:

Two Sample t-test

data: x and y
t = -3.5389, df = 16, p-value = 0.0013649
alternative hypothesis: true difference is less than 0 //Checar
90 percent confidence interval:
-25.274688 -8.575312
sample estimates:
mean of x mean of y
115.200 132.125

3.- Los siguientes son datos de tiempos de combustión expresados en segundos de dos
diferentes posiciones de una marca de cerillos

Vertical Horizontal
20.3 30.5
21.5 21.2
23.5 25.7
20.3 18.5
20.7 34.6
21.6 12.5
22.5 21.5
20.9 26.5
20.5 28.6
22.5
45.7

a).- Pruebe al nivel de significancia α=0.05 si las varianzas son iguales.


b);- Dependiendo de la condición de las varianzas proceda a probar la igualdad de medias
empleando α=0.05.
c).- Obtenga un IC del 95% para la diferencia de medias.

Si se denota por Vi a los tiempos de combustión obtenidos en la posición vertical y por Hj


a los tiempos de combustión obtenidos en la posición horizontal entonces se tiene que las
siguientes estadísticas son:
xV  21.311 x H  26.164
S B  1.0937 S H  8.8495
nB  9 nH  11

También podría gustarte