Está en la página 1de 5

Paso 5: Interprete el

resultado
Prueba de la diferencia entre medias
cuando 1 2 0

En este ejemplo, y en la mayora de los que veremos, se probar si dos poblaciones tienen la misma media. Si esto ocurre (1 2)H0, la diferencia hipotetizada entre las dos medias es cero. Sin embargo, podemos investigar si los salarios promedio son alrededor de 10 centavos por hora ms bajos en la ciudad de Apex que en Eden. En ese caso, nuestras hiptesis seran:
H0: 1  2  0.10 Hiptesis nula: los salarios son $0.10 ms bajos en Apex que en Eden
H1: 1 2  0.10 Hiptesis alternativa: los salarios no son $0.10 ms bajos en Apex que en Eden
En este caso, la diferencia hipottica entre las dos medias sera (1 2)H0  0.10, y la diferencia estandarizada entre las medias de las muestras sera:
(x1  x2) (1  2)H0
z  
 x1  x2
(0.95  9.10)  (0.10)
 

0.053
 0.94

Pruebas de una cola


de la diferencia entre
medias

De acuerdo con este resultado, no rechazaramos la hiptesis nula.


Aunque el ejemplo fue de una prueba de dos colas, tambin podemos realizar pruebas de una cola de la diferencia entre dos medias de poblaciones. Los resultados de pruebas de una cola son conceptualmente parecidos a las pruebas de una cola de una sola media que analizamos en el captulo
8. Por ejemplo, si hubiramos querido probar si los salarios en Apex son menores que en Eden (o,
de manera equivalente, si los salarios en Eden son mayores que en Apex), nuestras hiptesis hubieran sido:
H0: 1  2 Hiptesis nula: los salarios son iguales en Apex y Eden
H1: 1 < 2 Hiptesis alternativa: los salarios son ms bajo en Apex que en Eden
sta sera una prueba de una cola con (1  2)H0  0.
Por ltimo, si hubiramos deseado probar si los salarios en Apex son 10 centavos por hora mayores que los salarios en Eden, entonces nuestras hiptesis hubieran sido:
H0: 1  2  0.10 Hiptesis nula: los salarios son $0.10 ms bajos en Apex que en Eden
H1: 1 < 2  0.10 Hiptesis alternativa: los salarios son ms de $0.10 ms bajos en Apex que en Eden
sta sera una prueba de una cola con (1  2)H0  0.10.

Sugerencia: al probar las diferencias entre dos medias, debe elegir si usa una
prueba de hiptesis de una cola o de dos
colas. Si la prueba se refiere a si dos medias son iguales o no son iguales, use la prueba de dos coSUGERENCIAS
Y
SUPOSICIONES

las que medir si una media es diferente de la otra (mayor


o menor). Si la prueba se refiere a si una media es significativamente mayor o significativamente menor que la otra,
una prueba de una cola es apropiada.

Ejercicios 9.2
Ejercicios de autoevaluacin
EA

364

9-1

Se recolectaron dos muestras independientes de observaciones. Para la primera muestra de 60 elementos,


la media fue 86 y la desviacin estndar 6. La segunda muestra de 75 elementos tena una media de 82 y
una desviacin estndar de 9.
a) Calcule el error estndar estimado de la diferencia entre las dos medias.

Captulo 9

Prueba de hiptesis: pruebas de dos muestras

EA

9-2

b) Con  0.01, pruebe si es razonable que se considere que las dos muestras vienen de poblaciones
con la misma media.
En 1993, el Consejo de Estndares para Contabilidad Financiera (CECF) consider una propuesta para
requerir que las compaas informaran el efecto potencial de la opcin de compra de acciones de los empleados sobre los ingresos por accin (IPA). Una muestra aleatoria de 41 empresas de alta tecnologa (AT)
revel que la nueva propuesta reducira el IPA en un promedio del 13.8%, con una desviacin estndar del
18.9%. Una nuestra aleatoria de 35 productores de bienes de consumo (BC) mostr que la propuesta reducira el IPA en 9.1% en promedio, con desviacin estndar del 8.7%. Con base en estas muestras, es
razonable concluir (para  0.10) que la propuesta de la CECF causara una mayor reduccin en el IPA
para las empresas de alta tecnologa que para los productores de bienes de consumo?

Conceptos bsicos

9-1

Se tomaron dos muestras independientes. Para la primera de 42 elementos, la media fue 32.3 y la varianza 9. La segunda muestra de 57 elementos tena media de 34 y varianza de 16.
a) Calcule el error estndar estimado de la diferencia entre las dos medias.
b) Con  0.05, pruebe si existe suficiente evidencia para mostrar que la segunda poblacin tiene una
media mayor.

Aplicaciones

9-2

Block, una compaa fabricante de chips para computadoras, est en proceso de decidir si sustituye su lnea de ensamble semiautomtica por otra completamente automatizada. Block ha reunido algunos datos
de pruebas preliminares acerca de la produccin de chips por hora que se resumen en la tabla siguiente y
desea saber si debe actualizar su lnea de ensamble. Establezca (y pruebe con  0.02) las hiptesis apropiadas para ayudar a Block a tomar una decisin.

Lnea semiautomtica
Lnea automtica

9-3

9-4

9-5

9-6

198
206

32
29

150
200

Dos laboratorios de investigacin han producido, de manera independiente, medicamentos que alivian las
molestias de la artritis. El primer medicamento fue probado en un grupo de 90 personas que sufren la enfermedad y produjo un promedio de 8.5 horas de alivio, con desviacin estndar de 1.8 horas. El segundo
fue probado en 80 artrticos y produjo una media de 7.9 horas de alivio, con desviacin estndar de 2.1
horas. A un nivel de significancia de 0.05, el segundo medicamento proporciona un periodo de alivio significativamente ms corto?
El 1 de enero de 1996 se tom una muestra de 32 fondos mutualistas de la bolsa de valores, y se encontr que la tasa promedio de rendimiento anual durante los 30 das anteriores fue del 3.23%, con una desviacin estndar de la muestra del 0.51%. Un ao antes, una muestra de 38 fondos mutualistas indic una
tasa promedio de rendimiento del 4.36%, con una desviacin estndar de la muestra del 0.84%. Es razonable llegar a la conclusin (a un nivel  0.05) de que las tasas de inters del mercado de dinero declinaron durante 1995?
En septiembre de 1995, la Confederacin Automovilstica de las Carolinas investig al azar a 75 gasolineras en Carolina del Norte y Carolina del Sur y determin que el precio promedio de la gasolina regular
sin plomo en las bombas de autoservicio fue $1.059, con una desviacin estndar de 3.9 centavos. Tres
meses despus, en otra investigacin aleatoria de 50 gasolineras, se encontr un precio promedio de
$1.089, con una desviacin estndar de 6.8 centavos. A un nivel  0.02, cambi significativamente el
precio de la gasolina regular sin plomo en estos dos estados durante estos tres meses?
A pesar de la Ley de Pagos Igualitarios de 1963, en 1993 todava pareca que los hombres ganaban ms
que las mujeres en trabajos similares. En una muestra aleatoria de 38 operadores varones de mquinasherramienta se encontr que el salario medio por hora era $11.38, con una desviacin estndar de la
muestra de $1.84. Se tom una muestra aleatoria de 45 operadoras de mquinas-herramienta y se obtuvo
un salario medio por hora de $8.42, con desviacin estndar de la muestra de $1.31. Segn estas dos muestras, es razonable llegar a la conclusin (a un nivel  0.01) de que los operadores ganan ms de $2.00
por hora que las operadoras?
9.2

Pruebas para diferencias entre medias: muestras grandes

365

Ejercicios 9.3
Ejercicios de autoevaluacin
EA

9-3

EA

9-4

Una organizacin de investigacin de mercados selecciona varios modelos de automviles cada ao y evala su eficiencia en el consumo de combustible. Este ao, en el anlisis de dos modelos subcompactos similares de dos fabricantes distintos, el millaje promedio de 12 autos de la marca A fue 27.2 millas por galn, y la desviacin estndar fue 3.8 mpg. Los 9 autos de la marca B que se probaron promediaron 32.1
mpg con desviacin estndar de 4.3 mpg. Para  0.01, se puede concluir que la marca A da un millaje promedio menor que la marca B?
Connie Rodriguez, la decana de estudiantes en el Midstate College, se pregunta cul ser la distribucin
de calificaciones en la escuela. Ha odo quejas de que el promedio general en la escuela de administracin est cerca de 0.25 ms abajo que en las universidades de artes y ciencias. Un muestreo aleatorio rpido produjo los siguientes promedios generales.
Administracin:
Artes y ciencias:

2.86
3.35

2.77
3.32

3.18
3.36

2.80
3.63

3.14
3.41

2.87
3.37

3.19
3.45

3.24
3.43

2.91
3.44

3.00
3.17

2.83
3.26

3.18

3.41

Indican estos datos que existe una base para las quejas? Establezca y pruebe las hiptesis adecuadas para  0.02.

Aplicaciones

9-8

9-9

Una organizacin de crdito y seguros ha desarrollado un nuevo mtodo de alta tecnologa para capacitar
al nuevo personal de ventas. La compaa obtuvo una muestra de 16 empleados capacitados de la manera original y encontr ventas diarias promedio de $688 con desviacin estndar de la muestra de $32.63.
Tambin tomaron una muestra de 11 empleados capacitados con el mtodo nuevo y encontraron un promedio de ventas diarias de $706 con desviacin estndar de la muestra de $24.84. Para  0.05, puede
la compaa concluir que el promedio diario de ventas aumenta con el nuevo plan?
Una empresa grande de corretaje de acciones desea determinar qu tanto xito han tenido sus nuevos ejecutivos de cuenta en la consecucin de clientes. Despus de terminar su capacitacin, los nuevos ejecutivos pasan varias semanas haciendo llamadas a posibles clientes, tratando de que los prospectos abran
cuentas con la empresa. Los datos siguientes dan el nmero de cuentas nuevas abiertas durante las primeras dos semanas por 10 ejecutivas y 8 ejecutivos de cuenta escogidos aleatoriamente. A un nivel de
 0.05, parece que las mujeres son ms efectivas que los hombres para conseguir nuevas cuentas?
Nmero de cuentas nuevas
Ejecutivas de cuenta
Ejecutivos de cuenta

370

9-10

9-11

9-12

12
13

11
10

14
11

13
12

13
13

14
12

13
10

12
12

14

12

Para celebrar su primer aniversario, Randy Nelson decidi comprar un par de aretes de diamantes para su
esposa Debbie. Le ensearon 9 pares de aretes con gemas que pesaban aproximadamente 2 quilates por
par. Debido a las diferencias en color y calidad de las piedras, los precios variaban de una joya a otra. El
precio promedio fue $2,990, con una desviacin estndar de la muestra de $370. Adems le ensearon
6 pares con piedras en forma de gota, tambin con un peso aproximado de 2 quilates por par. Estos pendientes tenan un precio promedio de $3,065 con desviacin estndar de $805. Con base en esta evidencia, puede Randy llegar a la conclusin (a un nivel de significancia de 0.05) de que los diamantes con
forma de gota cuestan ms, en promedio, que los otros?
Una muestra de tasas hipotecarias convencionales a 30 aos tomadas al azar en 11 bancos de California
produjo una tasa media del 7.61% y una desviacin estndar del 0.39%. Una muestra parecida tomada
aleatoriamente en ocho bancos de Pennsylvania tuvo una tasa media del 7.43%, con desviacin estndar
del 0.56%. Estas muestras proporcionan evidencia para llegar a la conclusin (a un nivel  0.10) de
que las tasas de hipotecas convencionales de California y Pennsylvania provienen de poblaciones con medias distintas?
Debido a que los reembolsos de impuestos se pagan con ms rapidez cuando se solicitan electrnicamente, el comisionado del Servicio Interno de Contribuciones se preguntaba si los reembolsos por devolucin
de impuestos solicitados por correo eran menores que los solicitados electrnicamente. Observando sola-

Captulo 9

Prueba de hiptesis: pruebas de dos muestras

9-13

mente los reembolsos reclamados, una muestra de 17 solicitados por correo tuvo un reembolso medio de
$563 y una desviacin estndar de $378. Los reembolsos promedio reclamados en 13 solicitudes electrnicas fueron de $958, con desviacin estndar de la muestra de $619. A un nivel  0.01, estos datos
apoyan la especulacin del Comisionado?
En la actualidad, Llantas Greatyear produce sus neumticos en la planta de Wilmington, Carolina del Norte, con dos turnos de 12 horas. Los empleados del turno de noche planean pedir un aumento porque piensan
que estn produciendo ms llantas por turno que el turno de da. Como la compaa gana ms durante el
turno de noche, esos empleados tambin deben ganar ms, declara el representante de ese turno. I. M.
Checking, el supervisor de produccin de Greatyear, selecciona al azar algunas corridas de produccin diarias de cada turno con los resultados que se presentan en la tabla (en miles de llantas producidas).
Turno

Produccin (en miles)

Da

107.5

118.6

124.6

101.6

113.6

119.6

120.6

109.6

105.9

Noche

115.6

109.4

121.6

128.7

136.6

125.4

121.3

108.6

117.5

Indican estos datos, para  0.01, que el turno de noche produce ms llantas por turno?

Soluciones a los ejercicios de autoevaluacin


EA

9-3

sA  3.8

nA  12

H0: A  B
sp 

xA  27.2

H1: A B

sB  4.3

nB  9

xB  32.1

 0.01


(nA  1)s2A  (nB  1)s2B


nA  nB  2

11(3.8)2  8(4.3)2
  4.0181 mpg
19

El lmite inferior de la regin de aceptacin es t  2.539, o


xA  xB  0  tsp

    2.539(4.0181)   

n
n
12
9
1

 4.499 mpg
(xA  xB)  (A  B)H
(27.2  32.1)  0
Como el valor observado t  0  
1
1
1
1
4.0181   
sp   
12
9
nA
nB

EA

9-4

 2.766 < 2.539 (o xA  xB  4.9 4.499), se rechaza H0. La marca B entrega un millaje significativamente mayor que el de la marca A.
nB  11
Muestra 1 (administracin): sB  0.176
xB  2.98
Muestra 2 (artes y ciencias): sA  0.121
H0: B  A  0.25
sp 

nA  13

H1: B  A  0.25

xA  3.368
 0.02


(nB  1)s2B  (nA  1)s2A


nB  nA  2

10(0.176)2  12(0.121)2
  0.1485
22

Los lmites de la regin de aceptacin son t 


2.508, o
xB  xA  (B  A)H0
tsp

2.508(0.1485)
9.3

    0.25

n
n
1

    (0.4026, 0.0974)

11
13
1

Pruebas para diferencias entre medias: muestras pequeas

371

El procedimiento es casi igual que el


usado al comparar las diferencias entre
dos medias de muestras independientes.
La nica diferencia en este caso es que
primero se usan las proporciones combinadas de ambas
muestras para estimar la proporcin global, despus la resSUGERENCIAS
Y
SUPOSICIONES

puesta sirve para estimar el error estndar de la diferencia


entre las dos proporciones. Sugerencia: si la prueba se refiere a si una proporcin es significativamente diferente de
la otra, se usa la prueba de dos colas; si la prueba pregunta
si una proporcin es significativamente mayor o menor que
la otra, entonces una prueba de una cola es adecuada.

Ejercicios 9.5
Ejercicios de autoevaluacin
EA

9-7

EA

9-8

Una cadena de hoteles grande intenta decidir si debe convertir ms de sus cuartos en habitaciones de no
fumar. El ao pasado, en una muestra aleatoria de 400 huspedes, 166 pidieron cuartos de no fumar. Este ao, 205 huspedes en una muestra de 380 prefirieron que no se fumara en su habitacin. Recomendara que la cadena hotelera convirtiera ms habitaciones en lugares de no fumar? Apoye su recomendacin
con la hiptesis adecuada a un nivel de significancia de 0.01.
Dos reas diferentes de una gran ciudad del este de Estados Unidos se estudian como sitios para abrir guarderas. De 200 casas encuestadas en una seccin, la proporcin de ellas en las que la madre trabaja tiempo
completo es 0.52. En otra seccin, el 40% de las 150 casas del estudio tiene madres que trabajan tiempo completo. Para un nivel de significancia de 0.04, existe una diferencia significativa en las proporciones de madres que trabajan tiempo completo en las dos reas de la ciudad?

Aplicaciones

384

9-20

9-21

9-22

9-23

El viernes, aument el precio (avanzaron) de 11 acciones de una muestra aleatoria de 40 tomada de las
2,500 acciones negociadas en la Bolsa de Valores de Nueva York. En una muestra tomada el jueves, de 60
acciones de la misma Bolsa, 24 acciones avanzaron. A un nivel  0.10, puede llegar a la conclusin
de que una proporcin menor de las acciones de la Bolsa de Valores avanzaron el viernes con respecto al
jueves?
MacroSwift acaba de liberar al mercado un nuevo procesador de textos y la compaa est interesada en
determinar si las personas en el grupo de edad 30-39 califican al programa de manera distinta a las del
grupo 40-49. MacroSwift muestre al azar a 175 personas del grupo 30-39 que compraron el producto y
encontr que 87 calificaron al programa como excelente; de ellos, 52 compraran una actualizacin. Tambin muestre a 220 personas del grupo 40-49 y encontr que 94 calificaron al software como excelente;
de ellos, 37 compraran una actualizacin. Hay una diferencia significativa en las proporciones de personas en los dos grupos de edad que califican al programa como excelente al nivel  0.05? Es cierto
el mismo resultado en cuanto a las proporciones de personas que planean comprar una actualizacin?
Una planta de energa impulsada por carbn est considerando dos sistemas diferentes para reducir la emisin de contaminantes. El primer sistema reduce la emisin a niveles aceptables el 68% del tiempo, segn 200 muestras de aire. El segundo sistema, ms costoso, la reduce a niveles aceptables el 76% del tiempo, de acuerdo con 250 muestras. Si el sistema costoso es significativamente ms efectivo que el otro al
reducir la emisin de contaminantes a niveles aceptables, entonces la administracin de la planta instalar el sistema costoso. Qu sistema se debe instalar si la administracin usa un nivel de significancia de
0.02 al tomar su decisin?
Un grupo de investigadores mdicos est llevando a cabo pruebas en pacientes para determinar la efectividad de una nueva medicina contra la hipertensin. Se eligieron al azar pacientes con alta presin sangunea y se asignaron, tambin en forma aleatoria, a un grupo de control (que recibi un conocido medicamento contra la hipertensin) o al grupo de tratamiento (que recibi la nueva medicina). Los mdicos
registraron el porcentaje de pacientes cuya presin arterial se redujo a un nivel normal despus de un ao
de tratamiento. Al nivel de significancia de 0.01, pruebe las hiptesis apropiadas para determinar si la nueva medicina es significativamente ms efectiva para reducir la presin sangunea que la medicina conocida.

Captulo 9

Prueba de hiptesis: pruebas de dos muestras