Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Un test de hipótesis para dos muestras es similar en muchos aspectos al test para una muestra.
Vale la pena insistir en que posiblemente los métodos de pruebas de hipótesis son una de las
metodologías estadísticas más importantes y útiles. Además, es un tema considerablemente
amplio y, por ello, conviene hacer una pausa para presentar un panorama general que
proporcione una idea global sobre el tema para visualizar mejor el terreno
A su vez en las pruebas de hipótesis sobre medias, además del asunto del tamaño de la muestra,
es necesario considerar si se conocen o no las varianzas poblacionales y si puede o no asumir
que son iguales.
Para probar si existe o no diferencia entre las varianzas de 2 poblaciones puede utilizarse como
estadístico de prueba la F de la distribución F de Fisher, llamada así en honor del destacado
estadístico Ronald Aylmer Fisher, que se calcula como el cociente de las varianzas de las 2
poblaciones:
𝜎12
𝐹=
𝜎22
Que sería la expresión teórica de F. Y el valor calculado de F a partir de las varianzas muestrales:
𝑠12
𝐹𝑒𝑠𝑡 =
𝑠22
La prueba se lleva a cabo sobre la diferencia hipotética entre 2 varianzas poblacionales: H0: 𝜎12 −
𝜎22 = 0; para realizarla se obtienen las varianzas de 2 muestras tomadas de 2 poblaciones
diferentes. En otras palabras, esta prueba se realiza para poblaciones independientes, a las que
suele identificarse como 1 y 2. Las 2 varianzas muestrales son las que se utilizan como base para
hacer inferencias sobre sus correspondientes parámetros.
Si puede asumirse que las 2 varianzas poblacionales son iguales, 𝜎12 = 𝜎22 , entonces se utiliza,
como estadístico de prueba, la distribución F con n1 - 1 grados de libertad para el numerador y
n1 - 1 grados de libertad para el denominador; ya que el estadístico de prueba se calcula con los
datos muestrales se construye con un cociente
Tal como puede apreciarse, al tratarse de una distribución asimétrica, la tabla de la distribución
F no muestra valores de probabilidad para el lado izquierdo y éstos se requieren cuando la
prueba que se realiza es de 2 extremos (≠) o cuando es de un extremo y la región de rechazo
está en el lado izquierdo. En estos casos, para determinar los valores no mostrados, lo que se
hace es utilizar el inverso del valor correspondiente de las tablas, invirtiendo el orden de los
grados de libertad. En símbolos:
1
𝐹(1−∝;𝑛1 −1;𝑛2 −1) =
𝐹(∝;𝑛1 −1;𝑛2 −1)
𝑠12
𝐹𝑒𝑠𝑡 = 2
𝑠2
Según el resultado del paso 5 realizamos la conclusión “Existe suficiente evidencia estadística
para concluir que…” o “No existe suficiente evidencia estadística para concluir que…”
Ejemplo:
Se desea comparar el grado de aprendizaje en matemáticas en 2 escuelas del mismo nivel que
utilizan métodos de enseñanza diferentes. Para aplicar la prueba t para la diferencia entre 2
medias, debe ser posible suponer que ambas poblaciones tienen la misma varianza. Por ello,
antes de realizar la prueba sobre las medias, es conveniente realizar una prueba sobre la
igualdad de varianzas de las 2 poblaciones. Al hacer esta prueba, se toma una muestra aleatoria
de 21 estudiantes en cada una de las 2 escuelas y se obtienen los siguientes resultados:
Escuela 1 Escuela 2
n1 = 21 n1 = 21
𝑋̅1 = 7.9 𝑋̅1 = 8.3
S1 = 1.1 S1 = 1.21
Entonces, como este valor empírico de F es mayor que 0.41 y menor que 2.46, no se rechaza la
hipótesis nula y se concluye que ambas poblaciones de estudiantes tienen la misma varianza.
Un fabricante de luminarias sospecha que una de sus líneas de producción está fabricando
productos con demasiada variabilidad en su vida útil. Para evaluar la situación, decide comparar
la varianza de una muestra de 25 de esas luminarias contra la varianza de otra muestra de 30
procedentes de una línea de producción que no está bajo sospecha. Se determinan las
correspondientes varianzas y se encuentra que la de la línea de producción sospechosa es de
900, en tanto que la otra es de 350. ¿Puede concluirse, con un nivel de significación de 1%, que
la variabilidad de la vida útil de las luminarias fabricadas en la línea de producción bajo sospecha
es mayor que la de aquellas que provienen de la línea de producción que trabaja
adecuadamente?
En cada tipo de pruebas se presentan distintas circunstancias entre las que sobresalen las
aplicaciones con muestras grandes o con muestras pequeñas. Del mismo modo que sucedió en
las pruebas de hipótesis para una muestra, y de la misma manera que sucedió en el tema de
estimaciones de parámetros, tratar con muestras grandes (n > 30) o muestras pequeñas (n < 30)
implica diferencias en los procedimientos.
Se presentan casos de pruebas de hipótesis con 2 características: las muestras son grandes,
tanto n1 como n2 son mayores que o iguales a 30, y se trata de muestras independientes, es
decir, muestras tomadas de 2 poblaciones diferentes.
Los diferentes casos de pruebas para 2 medias implican diferencias en el estadístico de prueba
pero, sobre todo, en la forma en la que se calcula el error estándar del estadístico, es decir, la
media de la distribución muestral del estadístico
Caso 1: Prueba de Hipótesis para la diferencia de medias cuando se conocen las varianzas de
las 2 poblaciones
𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 = 𝟎 𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 ≤ 𝟎 𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 ≥ 𝟎
𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 ≠ 𝟎 𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 > 𝟎 𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 < 𝟎
Paso 2: Se selecciona el nivel de significancia.
𝑋̅1 − 𝑋̅2
𝑍=
𝜎2 𝜎2
√ 1+ 2
𝑛1 𝑛2
Según el resultado del paso 5 realizamos la conclusión “Existe suficiente evidencia estadística
para concluir que…” o “No existe suficiente evidencia estadística para concluir que…”
𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 = 𝝁𝟎
𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 ≠ 𝝁𝟎
Paso 2: Se selecciona el nivel de significancia.
= 0.01
𝑋̅1 − 𝑋̅2
𝑍=
𝜎2 𝜎2
√ 1+ 2
𝑛1 𝑛2
Paso 6: Conclusión
No existe suficiente evidencia estadística para concluir que haya diferencia entre la
productividad de los 2 turnos.
Sin embargo, el caso más común es que no se conozcan las varianzas, entonces se utilizan las de
las muestras para estimarlas, y el procedimiento es exactamente igual.
Caso 2: Prueba de Hipótesis para la diferencia de medias cuando no se conocen las varianzas
de las 2 poblaciones y no se asume que sean iguales
𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 = 𝝁𝟎 𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 ≤ 𝝁𝟎 𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 ≥ 𝝁𝟎
𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 ≠ 𝝁𝟎 𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 > 𝝁𝟎 𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 < 𝝁𝟎
Paso 2: Se selecciona el nivel de significancia.
𝑋̅1 − 𝑋̅2
𝑍=
𝑠2 𝑠2
√ 1+ 2
𝑛1 𝑛2
Según el resultado del paso 5 realizamos la conclusión “Existe suficiente evidencia estadística
para concluir que…” o “No existe suficiente evidencia estadística para concluir que…”
Ejemplo:
Se desea probar si los salarios medios mensuales de los empleados oficinistas de 2 empresas del
ramo de servicios turísticos son iguales o no, con un nivel de significación de 1%. Para ello, se
toman muestras de ambas empresas y los datos correspondientes se resumen en la siguiente
tabla:
Empresa 1 Empresa 2
n1 = 50 n2 = 60
𝑋̅1 = 6000 𝑋̅2 = 5850
S1 = 300 S2 = 214
Resuelva este caso asumiendo que no conocen las varianzas de las 2 poblaciones y no son
iguales.
𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 = 𝝁𝟎
𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 ≠ 𝝁𝟎
Paso 2: Se selecciona el nivel de significancia.
= 0.01
𝑋̅1 − 𝑋̅2
𝑍=
𝑠2 𝑠2
√ 1+ 2
𝑛1 𝑛2
- 2.58 2.58
Paso 5: Se realiza los cálculos según la fórmula del paso 3.
Paso 6: Conclusión
existe suficiente evidencia estadística para concluir que los salarios medios mensuales de los
empleados oficinistas de 2 empresas del ramo de servicios turísticos son diferentes
Caso 3: Prueba de Hipótesis para la diferencia de medias cuando no conocen las varianzas de
las 2 poblaciones y se asume que sean iguales
𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 = 𝝁𝟎 𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 ≤ 𝝁𝟎 𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 ≥ 𝝁𝟎
𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 ≠ 𝝁𝟎 𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 > 𝝁𝟎 𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 < 𝝁𝟎
Paso 2: Se selecciona el nivel de significancia.
𝑋̅1 − 𝑋̅2
𝑍=
𝑠2 𝑠2
√ 𝑐 + 𝑐
𝑛1 𝑛2
Según el resultado del paso 5 realizamos la conclusión “Existe suficiente evidencia estadística
para concluir que…” o “No existe suficiente evidencia estadística para concluir que…”
Ejemplo
Un departamento de control de calidad desea evaluar 2 máquinas que fabrican ciertas piezas
circulares de plástico. Se desea saber si la maquina A las fabrica con un diámetro mayor que la
maquina B. Para ello, se toma una muestra de 35 piezas de la maquina A y se encuentra que su
diámetro tiene una media de 1.061 cm con varianza de 0.000442. En tanto que una muestra
aleatoria de 30 piezas de la maquina B arroja una media de 1.038 cm con varianza de 0.000228.
Si los diámetros de estas piezas se distribuyen de forma normal en las 2 máquinas y se sabe que
sus varianzas son iguales, compruebe la hipótesis de que la maquina A está fabricando piezas de
mayor diámetro, con un nivel de significación de 0.05.
1.64
Existe suficiente evidencia estadística para concluir que la maquina A las fabrica con un diámetro
mayor que la maquina B ciertas piezas circulares de plástico.
Prueba de Hipótesis para la diferencia de medias cuando no conocen las varianzas pero se
asume que son iguales
𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 = 𝝁𝟎 𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 ≤ 𝝁𝟎 𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 ≥ 𝝁𝟎
𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 ≠ 𝝁𝟎 𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 > 𝝁𝟎 𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 < 𝝁𝟎
Paso 2: Se selecciona el nivel de significancia.
𝑋̅1 − 𝑋̅2
𝑇=
2 2
√𝑠𝑐 + 𝑠𝑐
𝑛1 𝑛2
Según el resultado del paso 5 realizamos la conclusión “Existe suficiente evidencia estadística
para concluir que…” o “No existe suficiente evidencia estadística para concluir que…”
Ejemplo
Un departamento de control de calidad desea evaluar 2 máquinas que fabrican ciertas piezas
circulares de plástico. Se desea saber si la maquina A las fabrica con un diámetro mayor que la
maquina B. Para ello, se toma una muestra de 12 piezas de la maquina A y se encuentra que su
diámetro tiene una media de 1.061 cm con varianza de 0.000442. En tanto que una muestra
aleatoria de 10 piezas de la maquina B arroja una media de 1.038 cm con varianza de 0.000228.
Si los diámetros de estas piezas se distribuyen de forma normal en las 2 máquinas y se sabe que
sus varianzas son iguales, compruebe la hipótesis de que la maquina A está fabricando piezas de
mayor diámetro, con un nivel de significación de 0.05.
𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 ≤ 𝝁𝟎
𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 > 𝝁𝟎
Paso 2: Se selecciona el nivel de significancia.
= 0.05
Paso 3: Se identifica el estadístico de prueba.
𝑋̅1 − 𝑋̅2
𝑇=
2 2
√𝑠𝑐 + 𝑠𝑐
𝑛1 𝑛2
1.725
Existe suficiente evidencia estadística para concluir que la maquina A las fabrica con un diámetro
mayor que la maquina B ciertas piezas circulares de plástico.
Prueba de hipótesis para diferencia de Proporciones.
Cuando se desea probar una hipótesis sobre la diferencia entre 2 proporciones, puede
emplearse la distribución normal si se tienen tamaños de muestra lo suficientemente grandes.
𝑯𝟎 : 𝝅𝟏 − 𝝅𝟐 = 𝟎 𝑯𝟎 : 𝝅𝟏 − 𝝅𝟐 ≤ 𝟎𝟎 𝑯𝟎 : 𝝅𝟏 − 𝝅𝟐 ≥ 𝟎
𝑯𝟏 : 𝝅𝟏 − 𝝅𝟐 ≠ 𝟎 𝑯𝟏 : 𝝅𝟏 − 𝝅𝟐 > 𝟎 𝑯𝟏 : 𝝅𝟏 − 𝝅𝟐 < 𝟎
Paso 2: Se selecciona el nivel de significancia.
Según el resultado del paso 5 realizamos la conclusión “Existe suficiente evidencia estadística
para concluir que…” o “No existe suficiente evidencia estadística para concluir que…”
Ejemplo
Se desea probar si existe diferencia entre las proporciones de aficionados al futbol que tienen
estudios universitarios y los que no. De una muestra aleatoria de 100 hombres con estudios
universitarios se encuentra que 56 de ellos son aficionados a ese deporte. Otra muestra de 150
varones que no tienen esos estudios refleja que 90 manifiestan ser aficionados. Compruebe, con
un nivel de significación de 0.05, si existe diferencia entre las proporciones de aficionados en
ambas poblaciones.
𝑯𝟎 : 𝝅𝟏 − 𝝅𝟐 = 𝝁𝟎
𝑯𝟏 : 𝝅𝟏 − 𝝅𝟐 ≠ 𝝁𝟎
Paso 2: Se selecciona el nivel de significancia.
= 0.05
Paso 3: Se identifica el estadístico de prueba.
𝑝1 − 𝑝2
𝑍=
1 1
√𝑝𝑐 (1 − 𝑝𝑐 )( + )
𝑛1 𝑛2
𝑥1 + 𝑥2
𝑝𝑐 =
𝑛1 + 𝑛2
Paso 4: Se formula la regla de decisión
-1.96 1.96
𝑥1 + 𝑥2
𝑝𝑐 =
𝑛1 + 𝑛2
56 + 90
𝑝𝑐 =
100 + 150
146
𝑝𝑐 = = 0.584
250
0.56 − 0.60
𝑍𝑐 = −0.04 −0.04 𝑍𝑐 = −0.630
𝑍𝑐 = 𝑍𝑐 =
√0.584(1 − 0.584)( 1 + 1 ) √0.0040 0.0636
100 150
No existe suficiente evidencia estadística para concluir que las proporciones de aficionados al
futbol que tienen estudios universitarios y los que no sean diferentes.
Se analizó el caso de una prueba para la diferencia entre 2 medias provenientes de poblaciones
independientes.
En este caso, la prueba se convierte en una prueba sobre la diferencia entre las observaciones,
ya que se calculan las diferencias entre:
Con el propósito de determinar cualquier diferencia que exista entre dos grupos relacionados,
deben obtenerse las diferencias en los valores individuales de cada grupo. Cuando la desviación
estándar de la población de la diferencia es conocida y el tamaño de muestra es lo
suficientemente grande. La estadística de prueba Z es:
̅ − 𝜇𝑑
𝐷
𝑍= 𝜎𝑑
√𝑛
Sin embargo, en la mayoría de los casos no conocemos la desviación estándar real de la
población. La única información que se puede obtener son las estadísticas sumarias como la
media y la desviación estándar de muestra. Si se supone que la muestra de resultados es tomada
de manera aleatoria e independiente se puede realizar una prueba t para determinar si existe
una diferencia media de población significativa. La estadística seguirá una distribución t con n-1
grados de libertad.
H1= µd ≠ 0
̅
∑ 𝐷𝑖2 − 𝑛𝐷
𝑆𝑑 = √
𝑛−1
Ejemplos:
Par de llantas 1 2 3 4 5 6 7 8 9 10
80 km/h 42.27 54.03 56.67 48.51 36.56 68.34 40.14 50.82 47.84 45.60
100 km/h 38.90 50.03 49.14 45.82 37.76 58.26 34.34 48.99 45.28 44.64
Se desea probar si la duración de los neumáticos es mayor a menores velocidades, con un nivel
de significación de 0.01
Solución:
Par de llantas 1 2 3 4 5 6 7 8 9 10
80 km/h 42.27 54.03 56.67 48.51 36.56 68.34 40.14 50.82 47.84 45.6
100 km/h 38.9 50.03 49.14 45.82 37.76 58.26 34.34 48.99 45.28 44.64
D 3.37 4 7.53 2.69 -1.2 10.08 5.8 1.83 2.56 0.96
2
D 11.3569 16 56.7009 7.2361 1.44 101.6064 33.64 3.3489 6.5536 0.9216
𝑯𝟎 : 𝝁𝑫 ≤ 𝟎
𝑯𝟏 : 𝝁𝑫 > 𝟎
2.26
̅
∑ 𝐷𝑖2 − 𝑛𝐷 201.1844
𝑆𝑑 = √ 238.8044 − 10(3.762) 𝑆𝑑 = √ = 4.728
𝑛−1 𝑆𝑑 = √ 9
9−1
Existe suficiente evidencia estadística para concluir que la duración de los neumáticos es mayor
a menores velocidades.