Prueba de Hipótesis

Prueba de Hipótesis
Una hipótesis estadística es una presunción relativa a una o varias poblaciones, que puede ser cierta o no. Las
hipótesis estadísticas se pueden comprobar con la información extraída de las muestras y tanto si se aceptan
como si se rechazan se puede cometer un error.
La prueba de hipótesis comienza con una suposición, llamada hipótesis, que hacemos con respecto a
un parámetro de población. Después recolectamos datos de muestra, producimos estadísticas de muestra y
usamos esta información para decidir qué tan probable es que la población se comporte igual que la muestra.
La hipótesis formulada con intención de rechazarla se llama hipótesis nula. Rechazar H0 implica aceptar una
hipótesis alterna.
hipótesis nula
Es la suposición, oración o reclamo que deseamos probar sobre un parámetro
de la población, la cual se asume cierta hasta que haya evidencia que es falsa
y se simboliza H 0, o "H subcero". El término hipótesis nula surge de las
primeras aplicaciones agrícolas y médicas de la estadística. Con el fin de
probar la efectividad de un nuevo fertilizante o de una nueva medicina, la
hipótesis que se probara era que no tuvo efecto, es decir, no hubo diferencia
entre las muestras tratadas y las no tratadas.
Prueba de hipótesis
hipótesis alterna
Es el reclamo sobre un parámetro de la población, el cual se asume cierta si
la hipótesis nula resulta falsa. Si los resultados de nuestra muestra no
respaldan la hipótesis nula, debemos concluir que se cumple alguna otra cosa,
la conclusión que sí aceptamos se llama hipótesis alternativa y se simboliza
como H1 ("H subuno").
El propósito de la prueba de hipótesis no es cuestionar el valor calculado de la estadística de muestra, sino

hacer un juicio con respecto a la diferencia entre esa estadística de muestra y un parámetro de población
hipotetizado.
Ejemplo: Supongamos que deseamos probar la hipótesis de que la media de población es igual a 500. Lo
simbolizaríamos y leeríamos "La hipótesis nula es que la media de población es: H0 :  = 500 ".
  500

Para la hipótesis nula: H0 :  = 500 , existen tres hipótesis alternativas posibles: H1 :  500
 500

Ejemplo:
Supongamos que una administradora de un centro comercial nos dice que la eficiencia de trabajo
promedio de sus empleados es de al menos 90%. ¿Cómo podemos probar la validez de su hipótesis?
Podríamos calcular la eficiencia de una muestra de sus empleados. Si hiciéramos esto y la estadística de
muestra resultara ser de 95%, aceptaríamos la afirmación de la administradora. Sin embargo, si la estadística
de muestra resultara ser de 46%, rechazaríamos su afirmación por falsa. Podemos interpretar estos dos
resultados, 95% y 46%, si utilizamos el sentido común. Ahora supongamos que nuestra estadística de muestra
revela una eficiencia de 88%. Este valor es relativamente cercano a 90%. ¿Pero es lo suficientemente cercano
para que aceptemos como correcta la hipótesis de la administradora? Ya sea que aceptemos o rechacemos su
hipótesis, no podemos estar absolutamente seguros de que nuestra decisión sea la correcta; por consiguiente,
tendremos que aprender cómo enfrentar la incertidumbre en nuestra toma de decisiones.
Selección de un nivel de significancia

El nivel de significancia indicará el porcentaje de medias de muestra que está fuera de ciertos límites.
No existe un nivel de significancia único estándar o universal, puede ser de 5%, de 1% etc. Es posible probar
M.C. Rosario Cruz Guerrero. 1

una hipótesis a cualquier nivel de significancia, pero recordemos que de nuestra elección del estándar mínimo
para una probabilidad aceptable (nivel de significancia) surge el riesgo que asumimos del rechazar una hipótesis
nula cuando es cierta. Mientras más alto sea el nivel de significancia que utilizamos para probar una hipótesis,
mayor será la probabilidad de rechazar una hipótesis nula cuando es cierta.
Las zonas obscuras son zonas

de rechazo y el resto es zona de
aceptación.
En la figura se ilustra una prueba de

hipótesis a tres niveles de significancia
diferentes: 0,01, 0.10 y 0.50.
En la primer y segunda gráfica,

aceptaríamos la hipótesis nula de que la
media de población es igual al valor
hipotetizado. Pero observe que en gráfica
tres, rechazaríamos esta misma hipótesis
nula ya que el nivel de significancia de 0.50
en esta parte es tan alto que raramente
aceptaríamos la hipótesis nula cuando no
sea cierta, pero, al mismo tiempo, con
frecuencia la rechazaríamos cuando es
cierta.
Si suponemos que la hipótesis es correcta

entonces el nivel de significancia indicará el
porcentaje de medias de muestra que está
fuera de ciertos límites.
Resulta conveniente hacer una

advertencia: Incluso si nuestra estadística
de muestra cae en la región de aceptación,
esto no prueba que nuestra hipótesis nula
(Ho) sea cierta, simplemente no nos proporciona evidencia estadística para rechazarla, Porque la única forma
en que puede aceptarse la hipótesis con seguridad es que conozcamos el parámetro de población y,
desafortunadamente, esto no es posible. Por consiguiente, siempre que afirmemos que aceptamos la hipótesis
nula, en realidad lo que queremos decir es que no hay suficiente evidencia estadística para rechazarla.
Errores tipo I y tipo II
Error tipo I (alfa):

Es el rechazo de una hipótesis nula cuando es cierta.
Errores
Error tipo II (beta):
Es el hecho de aceptar hipótesis nula cuando es falsa

(*) Decisión correcta que se busca
Detalles a tener en cuenta:

1)  y  están inversamente relacionadas.
Existe un equilibrio entre estos dos tipos de errores: La probabilidad de cometer un tipo de error puede
reducirse sólo si deseamos incrementar la probabilidad de cometer el otro tipo de error. Rara vez
aceptaremos una hipótesis nula cuando sea cierta, pero como precio de esta seguridad, a menudo
rechazaremos una hipótesis cuando es cierta. Puesto de otra manera, con el fin de obtener una  baja,
tendremos que tolerar una  alta.
2) Sólo pueden disminuirse las dos, aumentando n.
Evidentemente, la administración de compañía preferirá el error de tipo I sobre el de tipo II y, como resultado,
establecerá niveles de significancia muy altos en sus pruebas para obtener errores beta () bajas. Supongamos,
por otra parte, que cometer un error de tipo I implica desarmar todo un motor en la fábrica, pero cometer un
error de tipo II implica realizar reparaciones de garantía relativamente baratas por parte de los comerciantes.
Entonces es más probable que el fabricante prefiera el error de tipo II y que establezca menores niveles de
significancia en sus pruebas.
Pruebas de hipótesis de dos extremos (dos colas)
En esta prueba existen dos regiones de rechazo y

se rechazará la hipótesis nula si la media de
muestra es mayor o menor que la media de
población hipotetizada. Por tanto, una prueba de
dos extremos y es apropiada cuando la hipótesis
nula es  =  H0 (en donde  H0 es algún valor
especificado) y la hipótesis alternativa es
   H0 •
Ejemplo: Supongamos que un fabricante de focos eléctricos desea producirlos con una vida media de
 =  H0 = 1000 horas. Si el tiempo de vida es más corto, perderá clientes en favor de su competencia; si el tiempo
de vida es más largo, tendrá un costo de producción muy alto porque los filamentos serán excesivamente
gruesos. Para verificar que su proceso de producción esté operando adecuadamente, toma una muestra del
producto con el fin de probar la hipótesis Ho:  = 1000 u. Como no quiere desviarse significativamente de 1000
horas en ninguna dirección, la hipótesis alternativa adecuada es H1:   1000 , y entonces utiliza una prueba de
dos extremos. Esto es, rechaza la hipótesis nula si la vida media de los focos de la muestra está muy por arriba
de 1000 horas o muy por abajo de 1000 horas.

Prueba de un extremo (una cola)
Hay situaciones en las que no es apropiada una prueba de dos extremos por lo que debemos usar una
prueba de un extremo.
Prueba de extremo izquierdo (o prueba de extremo inferior)

Se utiliza cuando las hipótesis son H 0 =  H 0 y H 1   H1 . Sólo los valores de la
media de muestra que están significativamente por debajo de la media de
población hipotetizada harán que rechacemos la hipótesis nula en favor de la
hipótesis alternativa. Esta prueba se denomina prueba de extremo inferior
porque la región de rechazo está en el extremo inferior de la distribución de
la media de la muestra.
Prueba de un extremo
Prueba de extremo derecho (o prueba de Hextremo

=  H 0 superior)
y H 1   H1
Se utiliza cuando las hipótesis son . Sólo los valores de la
0
media de muestra que están significativamente por encima de la media de

población hipotetizada harán que rechacemos la hipótesis nula en favor de la
hipótesis alternativa. Esta prueba se denomina prueba de extremo superior
porque la región de rechazo está en el extremo superior de la distribución de
la media de la muestra.

Ejemplo: (Prueba de extremo izquierdo): Consideremos el caso de un comerciante que compra focos
eléctricos. El mayorista los compra en grandes lotes y no aceptará un lote de focos a menos que su vida media
sea de al menos 1,000 hrs. Cada vez que llega una remesa, prueba una muestra para decidir si la acepta o no.
La rechazará sólo si le parece que la vida media está por debajo de las 1,000 hrs. Si los focos son mejores de
lo esperado (con vida media superior a 1,000 hrs), no rechazará la remesa, porque esto no tendrá costo extra.
Así que las hipótesis del mayorista son H0 :  = 1000 hrs y H1 :   1000 hrs . Rechaza H 0 sólo si la vida media
de los focos muestreados está significativamente por debajo de las 1000 hrs.
Ejemplo (Prueba de extremo derecho): Un promotor de conciertos se interesa en atraer un número

suficiente de aficionados, o mayor, para agotar un evento; rechazar compradores de boletos aumentaría el
prestigio del evento; pero el hecho de no lograr atraer suficientes asistentes podría acarrear pérdidas
financieras. En contraste, un director de escuela se interesa en planear el calendario escolar con suficientes
"días de nevadas" para acomodar todo día de posible mal tiempo. Si llega un invierno benigno, el sistema
escolar no utilizará todos los días de nevadas permitidos, y no habría problema. Pero si se reservan insuficientes
días, la ampliación del año escolar desorganizaría los planes de vacaciones e incrementaría los costos.
Proceso de cinco pasos para realizar una prueba de hipótesis
Establece la hipótesis nula en términos de igualdad.
Establece la hipótesis alternativa, que puede hacerse

de tres maneras, dependiendo del interés del
investigador en el primer caso se habla de contraste
bilateral o de dos colas, y en los otros dos de lateral
(derecho en el 2º caso, o izquierdo en el 3º) o una
cola.
Decide qué distribución (t o z) es la apropiada y encuentre el (los) valor(es) crítico

(s) para el nivel de significancia escogido de la tabla adecuada.
Calcula el error estándar de la estadística demuestra. Usa el error estándar paro convertir el valor
observado de la estadística de muestra a un valor estandarizado.
Haz un diagrama de la distribución y marque la posición del valor de

muestra estandarizado y del(de los) valor(es) crítico(s) para la prueba
Compara el valor de la estadística de muestro estandarizado con el

(los) valores crítico(s) para esta prueba e interprete el resultado.

Ejercicios 3.1
1. Martha Inman, ingeniero de seguridad de carreteras, decide probar la capacidad de carga de un
puente que tiene 20 años de que fue construido. Se dispone de datos considerables de pruebas
similares sobre el mismo tipo de puente. ¿Qué prueba es la adecuada, la de un extremo o la de dos
extremos? Si la capacidad mínima de carga de este puente debe ser 10 toneladas, ¿cuáles son las
hipótesis nula y altenativa?
2. El doctor Ross Darrow cree que la nicotina de los cigarros ocasiona que los fumadores tengan mayores
ritmos cardiacos en promedio que los no fumadores. También cree que los fumadores ansían la nicotina
de los cigarros y no tan sólo fumar por la satisfacción física del acto, y, en consecuencia, que el
fumador promedio fumará más cigarros al día si cambia de una marca con un alto contenido de nicotina
a otra con un contenido menor.
a) Suponga que Ross sabe que los no fumadores tienen un ritmo cardiaco de 78 pulsaciones por minuto.
¿Cuáles son las hipótesis nula y alternativa adecuadas para probar su primera opinión?
b) Durante los tres meses anteriores, ha estado observando una muestra de 48 individuos que fuman
un promedio diario de 15 cigarros altos en nicotina. Les acaba de cambiar la marca de cigarros por
otra con un bajo contenido de nicotina. Establezca una hipótesis nula y otra alternativa para probar
su segunda opinión.
3. (Pruebas de dos extremos de medias) Un fabricante suministra los ejes traseros para los camiones
correo del Servicio Postal de los Estados Unidos de América. Estos ejes deben soportar 80,000
lb/pulg2 en pruebas de carga, pero un eje excesivamente fuerte eleva los costos de producción de
manera significativa. La larga experiencia indica que la desviación estándar de la fuerza de sus ejes
es 4,000 lb/pulg2. El fabricante selecciona una muestra de 100 ejes de la producción, los prueba y
encuentra que la capacidad de carga media de la muestra es 79,600 lb/pulg2. Si el fabricante de ejes
utiliza =0.05 en la prueba, ¿satisfarán los ejes sus requerimientos de carga?
4. (Prueba de un extremo de medias) Supongamos que un hospital usa grandes cantidades de dosis
envasadas de un medicamento particular. La dosis individual de esta medicina es 100 cm 3 (100 cc). La
acción del medicamento es tal que el cuerpo tolerará inocuamente dosis excesivas. Por otra parte, las
dosis insuficientes no producen el efecto médico deseado, e interfieren con el tratamiento del
paciente. El hospital ha adquirido la cantidad de dicho medicamento que necesita al mismo fabricante
durante varios años y sabe que la desviación estándar de la población es 2 ce. El hospital inspecciona
aleatoriamente 50 dosis de la medicina, tomadas de un suministro muy grande y encuentra que la media
de estas dosis es de 99.75 cc. El hospital establece un nivel de significancia de 0.10 y nos pregunta si
las dosis de esta remesa son demasiado pequeñas, ¿cómo podemos hallar la respuesta?
5. Atlas Sporting Goods ha puesto en marcha una promoción comercial especial para su estufa de propano
y siente que la promoción debe provocar un cambio en el precio para el consumidor. Atlas sabe que
antes de que comenzara la promoción, el precio promedio al menudeo de la estufa era de $44.95, con
una desviación estándar de $5-75. Atlas muestrea a 25 de sus minoristas después de iniciada la
promoción y encuentra que el precio medio de las estufas es ahora de $42.95. A un nivel de
significancia de 0.02, ¿tiene Atlas razones para creer que el precio promedio al menudeo para el
consumidor ha disminuido?
6. Hinton Press supone que la vida de su prensa rotativa más grande es de 14,500 horas, con una
desviación estándar conocida de 2,100 horas. De una muestra de 25 prensas, la compañía encuentra
una media de muestra de 13,000 horas. A un nivel de significancia de 0.01, ¿debería concluir la
compañía que la vida promedio de las prensas es menor que las hipotéticas 14,500 horas?
7. American Theaters sabe que una cierta película de éxito se exhibió un promedio de 84 días en cada
ciudad, y la desviación estándar correspondiente fue de 10 días. El administrador del distrito
sudoriental estaba interesado en comparar la popularidad de la película en su región con la de los
demás cines de la American. Eligió aleatoriamente 75 cines de su región y encontró que proyectaron
la película un promedio de 81.5 días.
a) Establezca hipótesis apropiadas para probar si hubo una diferencia significativa en la duración de la
exhibición de la película entre los cines del distrito sudoriental y los demás de la American.

b) A un nivel de significancia de 1%, pruebe estas hipótesis.
8. Diariamente el Servicio de Aduanas de Estados Unidos, ha interceptado a lo largo de su historia
alrededor de $28 millones en bienes de contrabando introducidos al país, con una desviación estándar
de $ 16 millones al día. En 64 días de 1992, elegidos aleatoriamente, el Servicio de Aduanas interceptó
un promedio de $30.3 millones en bienes de contrabando. ¿Indica esta muestra (a un nivel de
significancia de5%) que el Comisionado de Aduanas debería preocuparse por el incremento del
contrabando por encima de su nivel histórico?
a) Calcula el poder de la prueba para una media de $28, $29 y $30 millones.
b) ¿Qué sucede con la potencia de la prueba para una media de $28, $29 y $30 millones si el nivel de
significancia se cambia a 0.02?
9. Antes del embargo petrolero de 1973 y los subsecuentes incrementos en el precio del petróleo crudo,
el consumo de gasolina en Estados Unidos de América había aumentado a una tasa de ajuste temporal
de 0.57% mensual, con una desviación estándar de 0.10% mensual. En quince meses elegidos
aleatoriamente entre 1975 y 1985, el consumo de gasolina aumentó en una tasa promedio de sólo 0.33%
al mes. AQ un nivel de significancia de 0.01, ¿puede concluir que el aumento en el uso de la gasolina se
redujo como resultado del embargo y sus consecuencias?
a) Calcula el poder de la prueba para una media de 0.50, 0.45 y 0.40% mensual.
b) ¿Qué le sucede al poder de la prueba para una media de 0.50, 0.45 y 0.40% al mes si el nivel de
significancia se cambia a 0.04?
10. Bay City Bigleaguers, un equipo de béisbol semiprofesional, tiene al jugador que lidereó en la liga en
promedio de bateo durante muchos años. Durante varios años Joe Carver ha compilado un promedio
de bateo medio de .343, con una desviación estándar de .018. Este año, sin embargo, el promedio de
Joe fue de sólo .306. Joe está renegociando su contrato para el año siguiente, y el salario que podrá
obtener depende en gran medida de su habilidad de convencer al dueño del equipo de que su promedio
de bateo de este año no fue significativamente peor que en años anteriores. Si el dueño desea usar un
nivel de significancia de 0.02, ¿será reducido el salario de Joe?
11. Dada una media de muestra de 83 elementos, una desviación estándar de muestra de 12.5 y un tamaño
de muestra de 22, pruebe la hipótesis de que el valor de la media de población es 70, frente a la otra
opción de que es más de 70. Utilice el nivel de significancia de 0.025.
12. Si una muestra de 25 observaciones revela una media de muestra de 52 y una varianza de muestra de
4.2, pruebe la hipótesis de que la media de población es 65, frente a la otra opción de que es algún
otro valor. Use el nivel de significancia de 0.01.
13. La corredora de bienes raíces Elainc Snyderman tomó una muestra aleatoria de 12 hogares de un
prestigiado suburbio de Chicago y encontró que el valor de mercado promedio estimado era $780,000,
con una desviación estándar de $49,000. Pruebe la hipótesis de que para todas las casas del área, el
valor estimado medio es de $825,000, frente a la otra opción de que es menos de $825,000. Utilice
el nivel de significancia de 0.05.
14. Para una muestra de 60 mujeres, tomadas de un población de más de 5,000 inscritas en un programa
de reducción de peso en una cadena nacional de balnearios de aguas termales, la presión sanguínea
diastólica media de la muestra es de 101 y la desviación estándar de la muestra es de 42. A un nivel
de significancia de 0.02 ¿puede concluir que, en promedio, las mujeres inscritas en el programa tienen
una presión sanguínea diastólica que excede el valor de 75 recomendado por diversas sociedades
médicas?
15. El departamento de procesamiento de datos de una gran compañía de seguros de vida instaló nuevas
terminales de vídeo en color para remplazar las unidades monocromáticas que antes usaba. Los 95
operadores capacitados para usar las nueva máquinas promediaron 7.2 horas antes de lograr un nivel
de rendimiento satisfactorio. Su varianza de muestra fue de 16.2 horas al cuadrado. La larga
experiencia con los operadores en las viejas terminales monocromáticas indicaba que promediaban 8.1
horas en las máquinas, antes de que su rendimiento fuera satisfactorio. Al nivel de significancia de
0.01, ¿debería el supervisor concluir que las nuevas terminales son más fáciles de operar?

16. Un documental de televisión acerca de la alimentación excesiva afirmaba que los estadounidenses
tienen un sobrepeso aproximado de 10 lb en promedio. Para probar esta afirmación, se examinó a 18
individuos elegidos aleatoriamente, y se encontró que su sobrepeso promedio era de 12.4 lb, con una
desviación estándar de muestra de 2.7 lb. A un nivel de significancia de 0.01, ¿hay alguna razón para
dudar de la validez del valor afirmado de 10 lb?
17. Un bibliotecario universitario sospecha que el número promedio de libros sacados a préstamo por cada
estudiante por visita ha cambiado últimamente. Anteriormente, se sacaba un promedio de 3.4 libros.
Sin embargo, una muestra reciente de 23 estudiantes promedió 4.3 libros por visita, con una desviación
estándar de 1.5 libros. Al nivel de significancia de 0.01, ¿ha cambiado el promedio de préstamos?
18. Los estatutos ambientales federales aplicables a una cierta planta nuclear especifican que el agua
reciclada no debe, en promedio, exceder los 84 °F (28.9 °C) antes de que pueda ser lanzada al río que
corre junto a la planta. De 70 muestras, se encontró que el promedio de temperatura del agua reciclada
era de 86.3 °F (30.2 °C). Si la desviación estándar de la población es de 13.5 °F (7.5 °C), ¿debería la
planta ser multada por exceder las limitaciones del estatuto? Formule y pruebe las hipótesis
apropiadas con a = 0.05.
19. Inspectores del gobierno, al investigar los cargos levantados contra una embotelladora de bebidas no
alcohólicas, de Lousiana, que no llenaba adecuadamente sus productos, han muestreado 200 botellas
y encontraron que el promedio de llenado es de 31.7 onzas liquidas (aproximadamente 930 mi). Se
anuncia que las botellas contienen 32 onzas líquidas (946.33 mi). Se sabe que la desviación estándar
de la población es 1.5 onzas liquidas (44.36 mi). ¿Deberían concluir los inspectores, al nivel de
significancia de 2%, que las botellas están siendo llenadas con menos contenido?
20. En 1992, la tarifa aérea promedio con dos semanas de anticipación en el vuelo entre Raleigh-Durham,
Carolina del Norte y la ciudad de Nueva York era de $235. La desviación estándar de la población era
de $68. En una encuesta hecha en 1993 a 90 viajeros elegidos aleatoriamente entre estas dos ciudades
se encontró que habían pagado en promedio, $218.77 por sus boletos. ¿Cambió significativamente la
tarifa aérea promedio en esta ruta entre 1992 y 1993? ¿Cuál es el mayor nivel de significancia en el
que podría concluir que la tarifa promedio observada no es significativamente diferente de $235?
21. En la segunda semana de febrero de 1992, el número promedio de unidades producidas por semana
para todos los modelos de automóviles fabricados en Estados Unidos fue de 2,221. Una muestra de la
producción planeada por los fabricantes en la segunda semana de febrero de 1993 dio los siguientes
resultados:
Modelo Cámaro Sunbird Century Topaz Lynx Voyager LeBafon
Unidades 5004 2931 3773 1313 1292 3600 2600
¿Indican estos datos que la producción planeada fue de manera significativa diferente de la
producción real en el año anterior? Utilice el nivel de significancia de0.10.
22. Una compañía, recientemente criticada por no pagar lo mismo a hombres que a mujeres que trabajan
en los mismos puestos, declara que el sueldo promedio pagado a todos los empleados es de $23,500.
De una muestra aleatoria de 29 mujeres que laboran en la compañía, se calculó que el salario promedio
era de $23,000. Si se sabe que la desviación estándar de la población es $1,250 por estos empleos,
determine si puede ser razonable esperar (con dos errores estándar) que la media de la muestra sea
$23,000 si, en efecto, es cierto lo declarado por la compañía.
23. Una cadena regional de tiendas de abarrotes ha instalado cajas computarizadas para reducir la espera
del usuario y los costos de trabajo, así como para ayudar en el control de inventarios. Los 36 empleados
entrenados en las nuevas máquinas promediaron 12.4 intentos antes de lograr una transacción libre de
errores. La larga experiencia con cajeros entrenados para manejar las antiguas cajas registradoras
mostraba un promedio de 11.6 intentos antes de lograr una operación perfecta, con una desviación
estándar de 2.7 intentos. Con un nivel a = 0.01, ¿debería la cadena concluir que las nuevas registradoras
computarizadas son más difíciles de aprender a operar?

Pruebas para DIFERENCIAS ENTRE MEDIAS
Comparación de dos poblaciones
En muchas situaciones de toma de decisiones, la gente necesita determinar si los parámetros de dos
poblaciones son parecidos o diferentes.
Ejemplo: Una empresa, puede tener la intención de probar si sus empleadas reciben un salario menor que el
de sus empleados varones por realizar el mismo tipo de trabajo.
Ejemplo: Un director de capacitación puede tener la intención de determinar si la porción de empleados que
son susceptibles de promoción de una de las dependencias gubernamentales es diferente de la porción de
empleados de otra.
Ejemplo: Un fabricante de medicinas puede tener la necesidad de saber si un nuevo medicamento ocasiona
una reacción en un grupo de animales para experimentación y otra reacción distinta en otro grupo de animales.
En cada uno de los ejemplos dados anteriormente, los tomadores de decisiones están interesados en los
parámetros de dos poblaciones. En estas situaciones, no están tan interesados en el valor real de los
parámetros como en la relación entre los valores de dos parámetros; es decir, la forma en que éstos difieren.
¿Las empleadas ganan menos que los empleados por hacer el mismo tipo de trabajo? ¿Es la porción de
empleados susceptibles de promoción de una dependencia diferente a la porción de empleados de otra? ¿Un
grupo de animales para experimentación reacciona de manera diferente que otro grupo?.
MUESTRAS DEPENDIENTES
A menudo, el uso de muestras dependientes (o apareadas) nos permitirá llevar a cabo un análisis más preciso,
debido a que nos permitirán controlar factores externos
Los siguientes ejemplos muestran cuándo tratar dos muestras de igual tamaño como si fueran dependientes o
independientes:
1. Se pretende hacer un estudio de mercado de una empresa de refresco, y compararla con una empresa
competencia (MUESTRAS INDEPENDIENTES)
Se hace un estudio de mercado hoy en una empresa y se compara con el estudio de mercado de la
empresa hace 10 días (MUESTRAS DEPENDIENTES).
2. Un departamento de extensión agrícola del gobierno de Estados Unidos de América desea determinar
si una nueva semilla híbrida de maíz tiene una mayor producción que la vieja variedad estándar. Sí el
departamento le pide a diez granjeros que registren la producción de un acre plantado con la nueva
variedad de semilla y a otros diez que registren la producción de un acre plantado con la vieja variedad,
las dos muestras son independientes. Sin embargo, si le pide a 10 granjeros que planten un acre con
cada variedad de semilla y registren los resultados, entonces las muestras son dependientes, y la prueba
de diferencia apareada es la apropiada. En el último caso, se pueden controlar las diferencias debidas
al tipo de fertilizante e insecticida, la cantidad de lluvia, etc., debido a que cada granjero trata a sus
terrenos de la misma manera. En consecuencia, cualquier diferencia en la producción se puede atribuir
exclusivamente a la variedad plantada.
Recuerda que una prueba de muestras dependientes implica una hipótesis nula acerca de la media de las
diferencias individuales. Generalmente, se pueden detectar tales situaciones si uno no olvida que estas
pruebas son pruebas de "medidas repetidas.
Ejercicio 3.2
1. A un estadístico de recursos humanos se le pide que determine si los salarios por hora de los obreros
son los mismos en dos ciudades distintas. Suponga que la empresa desea el nivel de significancia 0.05
de que no hay diferencia entre los salarios por hora de los trabajadores de las dos ciudades:
Ciudad Salario medio por Desviación estándar Tamaño de la
hora de la muestra de la muestra muestra
Apex $8.95 $0.40 200
Eden $9.10 $0.60 175
2. La compañía fabricante de chips de memoria RAM para computadoras, está en proceso de decidir si
sustituye su línea de ensamblaje semiautomática, que tiene actualmente, por otra completamente

automatizada. Como le gustaría saber si debe actualizar su línea de ensamblado, ha reunido algunos
datos sobre pruebas acerca de la producción por hora de chips, esos datos se resumen en la tabla
siguiente. Establezca (y pruebe con a = 0.02) hipótesis apropiadas para ayudar a tomar una decisión.
−
x s n
Línea semiautomático 198 32 150
Línea automática 206 29 200
3. Se recolectaron dos muestras independientes de observaciones. Para la primera muestra de 60
elementos, la media fue de 86 y la desviación estándar de 6. La segunda muestra de 75 elementos tuvo
una media de 82 y una desviación estándar de 9.
a) Calcule el error estándar estimado de la diferencia entre las dos medias.
b) Usando o, =0.01, pruebe si las dos muestras pueden, de manera razonable, ser consideradas como
provenientes de poblaciones con la misma media.
4. Dos laboratorios de investigación han producido, independientemente, medicamentos que alivian las
molestias de artritis. El primer medicamento fue probado en un grupo de 90 personas que sufren
artritis y produjo un promedio de 8.5 horas de alivio, con una desviación estándar de 1.8 horas- El
segundo medicamento fue probado en 80 artríticos y produjo una medía de 7.9 horas de alivio, con una
desviación estándar de 2.1 horas. A un nivel 0.05 de significancia, ¿el segundo medicamento proporciona
un periodo de alivio significativamente más corto?
5. En septiembre de 1992, la Confederación Automovilística investigó aleatoriamente a 75 gasolinerías
en Texas y Ohio, y determinó que el precio promedio de la gasolina regular fue de $1.059, con una
desviación estándar de 3.9 centavos. Tres meses después, en otra investigación aleatoria de 50
gasolinerías, se encontró un precio promedio, para el mismo tipo de combustible, de $1,089, con una
desviación estándar de 6.8 centavos. A un nivel a = 0.02, ¿cambió significativamente el precio de la
gasolina regular en estos dos estados durante el periodo de tres meses considerado?
6. A pesar de la Ley de Pago Equitativo, en 2013 todavía parece que los hombres ganan más que las mujeres
en trabajos parecidos. En una muestra aleatoria de 38 operadores varones de máquinas se encontró
que el salario medio por hora fue de $11.38, con una desviación estándar de $1.84. Se tomó una muestra
aleatoria de 45 mujeres operadoras de máquinas y se obtuvo un salario medio por hora de $8.42, con
una desviación estándar de $1.31. Basándose en estas dos muestras, ¿es razonable llegar a la conclusión
(a un nivel  =- 0.01) de que los operadores ganan más de $2.00 por hora que las operadoras?
7. Una compañía investiga dos programas educativos para aumentar la sensibilidad de sus directores. El
programa original consiste en sesiones de preguntas y respuestas con los líderes de la comunidad. En
años recientes, se ha desarrollado un programa que implica clases formales con psicólogos y sociólogos
profesionales. El nuevo programa es más caro, y el presidente de la empresa desea saber, a un nivel de
0.05 de significancia, si el gasto ha aumentado la sensibilidad de sus directores.
Programa Sensibilidad media Número de Desviación estándar
Muestreado después de tomar administradores estimado de la sensibilidad
este programa. Observados después del programa.
Formal 92% 12 15%
Informal 84% 15 19%
La compañía desea probar si la sensibilidad adquirida después de tomar el nuevo programa es
significativamente mayor que la adquirida con el programa antiguo y más informal.
8. Una investigación de consumo selecciona de manera rutinaria varios modelos de automóvil cada año y
evalúa su eficiencia con respecto al combustible. En el estudio del presente año, de dos modelos
compactos fabricados por dos marcas distintas, el consumo promedio para doce automóviles de la marca
A fue de 27.2 millas por galón (mpg), con una desviación estándar de 3.8 mpg. Los nueve automóviles
de la marca B que fueron probados tuvieron un número promedio de 32.1 mpg, con una desviación
estándar de 4.3 mpg. A un nivel a = 0.01, ¿se deberá concluir que los automóviles de la marca B tienen
un número promedio de millas por unidad de combustible mayor que los automóviles de la marca A?
9. Para celebrar su primer aniversario, Randy Nelson decidió comprar un par de aretes de diamante para
su esposa Debbie. Le enseñaron nueve pares de aretes con gemas que pesaban aproximadamente dos

quilates por par. Debido a las diferencias en color y calidad de las piedras, los precio variaban de una
joya a la otra. El precio promedio fue de $2,990, con una desviación estándar de muestra de $370.
También le enseñaron seis pares con piedras en forma de gota, también con un peso aproximado de dos
quilates por cada par. Estos pendientes tenían un precio promedio de $3,065, con una desviación
estándar de $805. Con base en esta evidencia, ¿puede Randy llegar a la conclusión (a un nivel de
significancia de 0.05) de que los diamantes con forma de gota cuestan más, en promedio, que el otro
tipo de diamante?
10. Una muestra de tasas de hipotecas convencionales a 30 años tomadas al azar en once bancos de
California produjo una tasa media de 7.61 % y una desviación estándar de 0.39%. Una muestra parecida
tomada aleatoriamente en ocho bancos de Pennsylvania tuvo una tasa media de 7.43%, con una
desviación estándar de 0.56%. ¿Estas muestras proporcionan evidencia para llegar a la conclusión (a un
nivel  =0.10) de que las tasas de hipotecas convencionales de California y Pennsylvania provienen de
poblaciones con medias distintas?
11. Debido a que los reembolsos de impuestos se pagan con más rapidez cuando son solicitados
electrónicamente, el Comisionado del Servicio Interno de Rentas Publicas se estaba preguntando si los
reembolsos por devolución de impuestos solicitados por correo eran menores que aquéllos solicitados
electrónicamente. Observando solamente los reembolsos reclamados, una muestra de 17 solicitados
por correo tuvo un reembolso medio de $563, con una desviación estándar de $378. Los reembolsos
promedio reclamados en 13 solicitudes hechas electrónicamente fueron de $958, con una desviación
estándar de $619. A un nivel a ^ 0.01, ¿estos datos apoyan la especulación del Comisionado?
12. Connie Rodríguez, la Decana de los Estudiantes del Midstate College, se pregunta acerca de las
distribuciones de calificación en el nivel universitario. Ha escuchado rumores de que las calificaciones
de la Escuela de Comercio están aproximadamente 0.25 por debajo de las calificaciones de la Escuela
de Artes y Ciencias. Un rápido muestreo aleatorio arrojó las siguientes calificaciones:
Comercio 2.86 2.77 3.18 2.80 3.14 2.87 3.19 3.24 2.91 3.00 2.83
Artes y Ciencias 3.35 3.32 3.36 3.63 3.41 3.37 3.45 3.43 3.44 3.17 3.26 3.18 3.41
¿Estos datos indican que existe una base fundada para los rumores? Establezca y pruebe hipótesis
apropiadas a un nivel =0.02.
13. La fábrica Clic Pens ha probado dos tipos de anuncios publicitarios para su nueva pluma estilográfica
de tinta borrable. Un anuncio de mostrador fue colocado en una muestra aleatoria de 40 tiendas en el
mercado de prueba, y un anuncio de piso se colocó en otras 40 tiendas del área. El número medio de
plumas vendidas por tienda en un mes en los lugares donde había anuncios de mostrador fue de 42, con
una desviación estándar de 8. En cuanto a los anuncios de piso, el número medio de plumas vendidas por
tienda durante el mismo mes fue de 45, con una desviación estándar de 7. Al nivel  = 0.02, ¿hubo una
diferencia significativa entre las ventas en los establecimientos donde hubo tipos distintos de
publicidad?
14. La compañía General Cereats acaba de concluir una nueva campaña publicitaria para su producto Fruit
Crunch, el cereal natural para el desayuno que contiene nueces, cereales y fruta seca. Para probar la
efectividad de la campaña, el gerente de marca. Alan Neebe, encuesto a once clientes antes de la
campaña y a otros once después de ésta. A continuación se da el consumo semanal (en onzas) de Fruit
Crunch por parte de los consumidores:
Antes 14 5 18 18 30 10 8 26 13 29 24
Después 23 14 13 29 33 11 12 25 21 26 34
a) Al nivel a = 0.05, ¿puede Alan concluir que la campaña ha tenido éxito en aumentar la demanda del
producto?
b) Dada la investigación de Alan antes de la campaña, ¿puede usted sugerirle un mejor procedimiento
de muestreo para después de la campaña?
15. La compañía distribuidora Alien tiene la hipótesis de que una llamada telefónica es más efectiva que
una carta para acelerar el pago de cuentas atrasadas. Se contactaron dos grupos de cuentahabientes
atrasados, cada uno con uno de los dos métodos, y se registró el lapso entre el envío de la carta o la
llamada y el momento en que se recibió el pago:

Método utilizado Días hasta el pago
Carta 10 8 9 11 11 14 10
Llamada telefónica 7 4 5 4 8 6 9
a) Al nivel  = 0.025, ¿debería Alien llegar a la conclusión de que las cuentas atrasadas son pagadas
más rápidamente con una llamada que con una carta?
b) ¿Puede Allen concluir que las cuentas atrasadas responden con mayor rapidez a las llamadas
telefónicas?
16. Recientemente, un analgésico perdió algo de sus ventas ante un nuevo competidor. El competidor
anunciaba que su marca entra al torrente sanguíneo con más rapidez que el otro analgésico y, como
resultado de ello, alivia el dolor más pronto. Al laboratorio que fabrica el primer analgésico le gustaría
probar que no existe diferencia significativa entre los dos productos y, por consiguiente, que la
afirmación de su competidor es falsa. A manera de prueba preliminar, a nueve individuos se les
suministró el analgésico del laboratorio una vez al día durante tres semanas. En las siguientes tres
semanas, a los mismos sujetos se les dio el producto de la competencia. Para cada medicamento, se
registró el tiempo promedio en minutos que le tomó aliviar el dolor:
Individuo 1 2 3 4 5 6 7 8 9
Analgésico 16.5 25.5 23.0 14.5 28.0 10.0 21.5 18.5 15.5
Competidor 12.0 20.5 25.0 16.5 24.0 11.5 17.0 15.0 13.0
A un nivel a -= 0.10 ¿existe alguna diferencia significativa en el tiempo que les tomó a los medicamentos
aliviar el dolor?
17. Un químico que se encuentra desarrollando repelentes de insectos desea saber si una fórmula
recientemente desarrollada da mayor protección contra los piquetes de insectos que la que proporciona
el producto líder del mercado- En un experimento, a 14 voluntarios se les roció uno de los brazos con
el producto viejo y el otro brazo con la nueva fórmula. Luego cada individuo metió los brazos en una
cámara llena de mosquitos y otros insectos que pican. El número de piquetes recibidos en cada brazo
se registra en la tabla siguiente. Al nivel a = 0.01, ¿deberá el químico concluir que la nueva fórmula, de
hecho, es más efectiva que el producto líder en el mercado?
Individuo 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Fórmula vieja 5 2 5 4 3 6 2 4 2 6 5 7 1 3
Fórmula nueva 3 1 5 1 1 4 4 2 5 2 3 3 1 2
18. En un taller de herrería se ha cambiado la situación de sus soldadores y en lugar de pagárseles por
nómina se les paga ahora a destajo. Para ver si este cambio ha traído como consecuencia una variación
en la productividad de los trabajadores, se le pidió al encargado del taller que registrara la producción
de un día (número de piezas terminadas) por cada empleado. Utilizando los datos siguientes, pruebe al
nivel de significancia de 10% si existe diferencia significativa en la producción bajo las dos formas de
pago.
Tipo de pago Producción
Nómina 118 115 122 99 106 125 102 100 92 103 113 129
Destajo 115 126 113 110 135 102 124 137 108 128
19. ¿El nivel percibido de responsabilidad por una cierta acción está relacionado con la severidad de sus
consecuencias? Esta pregunta fue base de un estudio sobre responsabilidad en el que los sujetos leían
una descripción de un accidente ocurrido en una carretera federal. Las consecuencias, en términos de
costos materiales y de daños físicos, fueron clasificadas como menores y graves. Se utilizó un
cuestionario para medir el grado de responsabilidad que los individuos creían que debían poner al
personaje principal de la historia. A continuación presentamos los resultados para las consecuencias
menores y las graves que se le atribuyó al personaje principal. Si se utiliza un nivel de significancia del
0.025, ¿se concluye del estudio que las consecuencias graves conducen a una mayor atribución de
responsabilidad?
Consecuencias Grado de responsabilidad
Menores 4 5 3 3 4 1 2 6
Graves 4 5 4 6 7 8 6 5

20. (D) Un balneario de aguas curativas ha anunciado un programa de reducción de peso y afirma que el
participante promedio en el programa pierde más de 17 libras. Un ejecutivo un tanto sobrado de peso
está interesado en el programa, pero se muestra escéptico sobre lo que afirma el anuncio y solicita una
evidencia más fuerte. El balneario le permite elegir aleatoriamente los registros de diez participantes
y anotar el peso que tenían antes y después de haber llevado a cabo el programa. Estos datos se
presentan en la tabla 9-3.
Antes 189 202 220 207 194 177 193 202 208 233
Después 170 179 203 192 172 161 174 187 186 204
Encuentra el cambio medio de la pérdida de peso entre antes y después del tratamiento. Observa que
son muestras dependientes entre sí, pues la muestra de 10 personas ha sido observada 2 veces.
21. (D) Sherri Weich es una ingeniero de control de calidad que trabaja en el departamento de
manufactura de limpiadores de parabrisas de la Emsco. La empresa, actualmente, está considerando
utilizar dos nuevos hules sintéticos para sus limpiadores, y Sherri es la encargada de ver si los
limpiadores fabricados con los dos tipos de hule se desgastan de la misma manera. Equipó doce
automóviles que pertenecen a empleados de la Emsco con los dos nuevos limpiadores, uno de cada tipo
de material. En los automóviles 1 a 6 el limpiador derecho está fabricado con el material A y el izquierdo
con el material B; en los automóviles 7 a 12, el material A utilizado en el limpiador izquierdo. Los coches
fueron conducidos en condiciones normales hasta que los limpiadores no funcionaron adecuadamente
para limpiar el agua de lluvia de los parabrisas. Los datos corresponden al tiempo de vida útil (en días)
de los limpiadores. A un nivel a = 0.05,¿se desgastan de la misma manera los dos materiales?
Automóvil 1 2 3 4 5 6 7 8 9 10 11 12
Limpiador izq. 162 323 220 274 165 271 233 156 238 211 241 154
Limpiador der. 183 347 247 269 189 257 224 178 263 199 263 148
22. (D) A nueve comercializadores de componentes para computadora que operan en las principales áreas
metropolitanas se les pidió los precios de dos impresoras de matriz de punto parecidas, con anchos
estándar y fuentes de una cierta calidad. Los resultados de la investigación se consignan en la siguiente
tabla. A un nivel a = 0.05, ¿es razonable afirmar que, en promedio, la impresora Apson es más barata
que la impresora Okaydata?
Comerciante 1 2 3 4 5 6 7 8 9
Precio de Apson $ 350 419 385 360 405 395 389 409 375
Precio de Okaydata $370 425 369 375 389 385 395 425 400
23. (D) El club deportivo Aquarius Health ha estado anunciando un riguroso programa de acondicionamiento
físico. El club asegura que después de un mes de llevar el programa, un participante promedio será
capaz de hacer ocho lagartijas (o tracciones) más en dos minutos que las que podía hacer al principio.
¿La muestra aleatoria de diez participantes en el programa, cuyos datos se dan en la tabla siguiente,
apoya la afirmación del club? Utilice un nivel de significancia de 0.025.
Participante 1 2 3 4 5 6 7 8 9 10
Antes 38 11 34 25 17 38 12 27 32 29
Después 45 24 41 39 30 44 30 39 40 41

Prueba de Hipótesis

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Prueba de Hipótesis

Cargado por

Copyright:

Formatos disponibles

Prueba de Hipótesis

El propósito de la prueba de hipótesis no es cuestionar el valor calculado de la estadística de muestra, sino

Selección de un nivel de significancia

M.C. Rosario Cruz Guerrero. 1

Las zonas obscuras son zonas

En la figura se ilustra una prueba de

En la primer y segunda gráfica,

Si suponemos que la hipótesis es correcta

Resulta conveniente hacer una

Errores tipo I y tipo II

Error tipo I (alfa):

M.C. Rosario Cruz Guerrero. 2

Detalles a tener en cuenta:

Pruebas de hipótesis de dos extremos (dos colas)

En esta prueba existen dos regiones de rechazo y

M.C. Rosario Cruz Guerrero. 3

Prueba de extremo izquierdo (o prueba de extremo inferior)

Prueba de extremo derecho (o prueba de Hextremo

media de muestra que están significativamente por encima de la media de

M.C. Rosario Cruz Guerrero. 4

Ejemplo (Prueba de extremo derecho): Un promotor de conciertos se interesa en atraer un número

Proceso de cinco pasos para realizar una prueba de hipótesis

Establece la hipótesis nula en términos de igualdad.

Establece la hipótesis alternativa, que puede hacerse

Decide qué distribución (t o z) es la apropiada y encuentre el (los) valor(es) crítico

Haz un diagrama de la distribución y marque la posición del valor de

Compara el valor de la estadística de muestro estandarizado con el

M.C. Rosario Cruz Guerrero. 5

M.C. Rosario Cruz Guerrero. 6

M.C. Rosario Cruz Guerrero. 7

M.C. Rosario Cruz Guerrero. 8

M.C. Rosario Cruz Guerrero. 9

M.C. Rosario Cruz Guerrero. 10

M.C. Rosario Cruz Guerrero. 11

M.C. Rosario Cruz Guerrero. 12

M.C. Rosario Cruz Guerrero. 13

También podría gustarte