Está en la página 1de 22

Prueba de hipótesis para la

diferencia de medias con


muestras independientes

Mg. Yuri Juan Balcona Mamani


0009-0003-5314-7217

Universidad Católica San Pablo

Arequipa, 2023

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


Objetivos
Realizar una prueba de hipótesis de una afirmación sobre dos medias
poblacionales independientes.
Usar el programa R y el entorno RStudio como herramienta de análisis.

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


Caso I:
Varianzas conocidas

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


Distribución normal estándar

Z → N (0, 1)
La variable aleatoria Z sigue una distribución normal estándar, con media
µ = 0 y varianza σ 2 = 1, si su función de densidad es de la forma:

1 x2
f (x) = √ e− 2 , −∞ < x < ∞

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


Requisitos
La muestras son independientes y aleatorias simples.
Se cumple al menos una de las siguientes condiciones: los dos tamaños
de muestra son grandes (con n1 ≥ 30 y n2 ≥ 30) o ambas muestras
provienen de poblaciones que tienen distribuciones normales.

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


Planteamiento de hipótesis

H 0 : µ1 − µ2 = ∆ 0 H0 : µ1 − µ2 ≤ ∆0 H0 : µ1 − µ2 ≥ ∆0

H1 : µ1 − µ2 ̸= ∆0 H1 : µ1 − µ2 > ∆0 H1 : µ1 − µ2 < ∆0

H0 : Hipótesis nula. µ1 : Media de la población 1.


H1 : Hipótesis alternativa. µ2 : Media de la población 2.

Estadı́stico de prueba
(x̄1 − x̄2 ) − (µ1 − µ2 )
Z= q 2
σ1 σ2
n1
+ n22
Z → N (0, 1).

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


Intervalo de confianza a un nivel de confianza del (1 − α)100 %
s s
σ12 σ22 σ12 σ2
x̄1 − x̄2 − z α2 + ≤ µ1 − µ2 ≤ x̄1 − x̄2 + z α2 + 2
n1 n2 n1 n2

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


Ejemplo 1
[Montgomery and Runger, 2003] (p. 385). Se usan dos máquinas para llenar
botellas de plástico con un volumen neto de 16 onzas. Puede suponerse que
el volumen de llenado es normal, con una desviación estándar de σ1 = 0.02
y σ2 = 0.025 onzas. Uno de los miembros del personal de ingenierı́a de
calidad sospecha que ambas máquinas hacen el llenado con el mismo
volumen neto medio, sea este volumen 16 onzas o no. Se toma una muestra
aleatoria de 10 botellas de la producción de cada máquina.

Máq1 16.03 16.04 16.05 16.05 16.02 16.01 15.96 15.98 16.02 15.99
Máq2 16.02 15.97 15.96 16.01 15.99 16.03 16.04 16.02 16.01 16.00

¿Piensa el lector que el ingeniero esta en lo correcto? Use α = 0.05.

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


1 Parámetros: µ1 y µ2 (Volumen 7 Valor del estadı́stico de prueba:
neto medio del contenido con el
que se llenan las botellas usando (16.015 − 16.005) − (0)
Z= q ≈ 0.9877
la máquina 1 y máquina 2.) 0.022
+ 0.025
2
10 10
2 H 0 : µ1 = µ2
3 H1 : µ1 ̸= µ2
4 Nivel de significación: α = 0.05
5 Estadı́stico de prueba:
(x̄1 − x̄2 ) − (µ1 − µ2 )
Z= q 2
σ1 σ2
n1
+ n22
Z ̸∈ RC. Por lo tanto, no se
6 Verificar los supuestos: rechaza H0 .
La muestras son 8 Valor P
independientes y aleatorias
simples. Z −0.9877
1 x2
Se cumple al menos una de P = 2· √ e− 2 dx ≈ 0.323
las siguientes condiciones: los −∞ 2π
dos tamaños de muestra son
grandes (con n1 ≥ 30 y P > α ⇒ No se rechaza H0 .
n2 ≥ 30) o ambas muestras
provienen de poblaciones que
9 Conclusión: Existe suficiente
tienen distribuciones evidencia muestral para validar
normales. la sospecha del ingeniero.
Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II
Ejercicio 1
[Montgomery and Runger, 2003] (p. 386). Un fabricante de componentes
electrónicos puede usar indistintamente dos tipos de plástico. La resistencia
a la ruptura de este plástico es importante. Se sabe que σ1 = σ2 = 1.0 psi.
A partir de muestras aleatorias de tamaño n1 = 10 y n2 = 12, se obtiene
x̄1 = 162.5 y x̄2 = 155. La compañı́a no adoptará el plástico 1 a menos que
su resistencia media a la ruptura exceda la del plástico 2 en al menos 10 psi.
Con base en la información de las muestras, ¿deberá utilizar el plástico 1?

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


Ejercicio 2
[Montgomery and Runger, 2003] (p. 387). Se piensa que la concentración
del ingrediente activo de un detergente lı́quido para lavar ropa es afectada
por el tipo de catalizador que se utiliza en el proceso. Se sabe que la
desviación estándar de la concentración activa es 3 g/l, independientemente
del tipo de catalizador. Se hacen 10 observaciones de la concentración con
cada catalizador, y los datos se presentan a continuación:

Catalizador 1 57.9 66.2 65.4 65.4 65.2 62.6 67.6 63.7 67.2 71.0
Catalizador 2 66.4 71.7 70.3 69.3 64.8 69.6 68.6 69.4 65.3 68.8

¿Hay evidencia que indique que las medias de la concentración activa


dependen de la elección del catalizador?

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


Caso II:
Varianzas desconocidas

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


Distribución t de Student
La variable aleatoria T sigue una distribución t de Student si su función de
densidad es de la forma:

Γ k+1

2
f (x) =
√ h 2 i k+1 , −∞ < x < ∞
2
πkΓ k2 xk + 1

donde k = grados de libertad.

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


Suponga: σ1 = σ2
Planteamiento de hipótesis

H 0 : µ1 − µ2 = ∆ 0 H0 : µ1 − µ2 ≤ ∆0 H0 : µ1 − µ2 ≥ ∆0

H1 : µ1 − µ2 ̸= ∆0 H1 : µ1 − µ2 > ∆0 H1 : µ1 − µ2 < ∆0

H0 : Hipótesis nula. µ1 : Media de la población 1.


H1 : Hipótesis alternativa. µ2 : Media de la población 2.

Estadı́stico de prueba
Dados los supuestos de esta sección, la cantidad
(x̄1 − x̄2 ) − (µ1 − µ2 )
T = q
Sp n11 + n12

tiene una distribución t con n1 + n2 − 2 grados de libertad.


El estimador combinado de σ 2 , denotado por Sp2 está definido por:

(n1 − 1)S12 + (n2 − 1)S22


Sp2 =
n1 + n2 − 2

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


Suponga: σ1 ̸= σ2
Planteamiento de hipótesis

H 0 : µ1 − µ2 = ∆ 0 H0 : µ1 − µ2 ≤ ∆0 H0 : µ1 − µ2 ≥ ∆0

H1 : µ1 − µ2 ̸= ∆0 H1 : µ1 − µ2 > ∆0 H1 : µ1 − µ2 < ∆0

H0 : Hipótesis nula. µ1 : Media de la población 1.


H1 : Hipótesis alternativa. µ2 : Media de la población 2.

Estadı́stico de prueba
(x̄1 − x̄2 ) − (µ1 − µ2 )
T = q 2
S1 S2
n1
+ n22
tiene una distribución aproximadamente igual a la de t con los siguientes
grados de libertad

(V1 + V2 )2 S12 S2
df = V12 V22
, V1 = , V2 = 2
+ n1 n2
n1 −1 n2 −1

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


Ejemplo 2
[Montgomery and Runger, 2003] (p. 401). En la manufactura de
semiconductores, es común el uso de un proceso de grabado por remojo
quı́mico para eliminar el silicio de la parte posterior de las obleas antes de
la metalización. La rapidez de grabado es una caracterı́stica importante en
este proceso y se sabe que sigue una distribución normal. Se compararon
dos soluciones de grabado diferentes, usando dos muestras aleatorias de 10
obleas para cada solución. La rapidez de grabado observadas fueron las
siguientes (en milipulgadas/min):

Solución 1 9.9 9.4 9.3 9.6 10.2 10.6 10.3 10.0 10.3 10.1
Solución 2 10.2 10.6 10.7 10.4 10.5 10.0 10.2 10.7 10.4 10.3

¿Los datos apoyan la afirmación de que la rapidez de grabado medio es la


misma para ambas soluciones? Para llegar a una conclusión, use α = 0.05 y
suponga que las varianzas de las dos poblaciones son iguales.

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


1 Parámetros: µ1 y µ2 (rapidez de provienen de poblaciones que
grabado medio respecto a la tienen distribuciones
solución 1 y solución 2) normales.
2 H 0 : µ1 = µ2
7 Valor del estadı́stico de prueba:
3 H1 : µ1 ̸= µ2 T = −2.8278 y Sp2 = 0.11561
4 Nivel de significación: α = 0.05
5 Estadı́stico de prueba:
(x̄1 − x̄2 ) − (µ1 − µ2 )
T = q
Sp n11 + n12
T ∈ RC. Por lo tanto, se
df = n1 + n2 − 2. rechaza H0 .
8 Valor P
(n1 − 1)S12 + (n2 − 1)S22
Sp2 = −2.8278
n1 + n2 − 2
Z
P = 2· f (x)dx ≈ 0.01115
6 Verificar los supuestos: −∞
La muestras son
independientes y aleatorias P ≤ α ⇒ Se rechaza H0 .
simples. 9 Conclusión: Existe evidencia
Se cumple al menos una de muestral para indicar que la
las siguientes condiciones: los
dos tamaños de muestra son rapidez de grabado medio no es
grandes (con n1 ≥ 30 y la misma para ambas
n2 ≥ 30) o ambas muestras soluciones.
Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II
Ejercicio 3
[Montgomery and Runger, 2003] (p. 401). Dos proveedores fabrican un
engrane de plástico usado en una impresora láser. La resistencia a impactos
de estos engranes, medida en libras - pie, es una caracterı́stica importante.
Una muestra de 10 engranes del proveedor 1 da como resultado x̄1 = 290 y
s1 = 12, mientras que otra muestra aleatoria de 16 engranes del segundo
proveedor da como resultado x̄2 = 321 y s2 = 22. ¿Hay evidencia en favor
de la afirmación de que los engranes del proveedor 2 tienen una resistencia a
impactos media más alta? Use α = 0.05 y suponga que las dos poblaciones
tienen una distribución normal pero las varianzas no son iguales.

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


Ejercicio 4
[Peck and Devore, 2011] (p. 521). Los autores del artı́culo “Sex and Salary:
A Survey of Purchasing and Supply Professionals” (Journal of Purchasing
and Supply Management [2008] : 112 − 124) realizaron un estudio en el que
se recopilaron los datos de los salarios de una muestra aleatoria de hombres
y una muestra aleatoria de mujeres que trabajaban como gerente de
compras y que eran suscriptores de la revista Purchasing. En la siguiente
tabla te presentamos una parte de los datos recolectados:

Masculino 81 69 81 76 76 74 69 76 79 65
Femenino 78 60 67 61 62 73 71 58 68 48

Suponga que es razonable considerar las dos muestras dadas aquı́ como
representativas de las poblaciones de interés: Gerentes de compras
masculinos y gerentes de compras femeninas. Use los datos dados y un nivel
de significancia de 0.05 para determinar si hay evidencia convincente de que
el salario medio anual de los gerentes de compras masculinos es mayor que
el salario medio anual de las gerentes de compras femeninas.

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


Ejercicio 5
[Triola, 2018] (p. 441) ¿Los profesores y las profesoras son califi
cados de manera diferente? A continuación se listan puntuaciones de
evaluación emitidos por estudiantes a sus profesoras y profesores, en el
conjunto de datos 17 “Evaluaciones de cursos” del apéndice B. Pruebe la afi
rmación de que las profesoras y los profesores tienen las mismas
puntuaciones medias de evaluación. ¿Parece haber una diferencia?

Masculino 4.4 3.4 4.8 2.9 4.4 4.9 3.5 3.7 3.4 4.8
Femenino 4.0 3.6 4.1 4.1 3.5 4.6 4.0 4.3 4.5 4.3

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


Bibliografı́a

[Montgomery and Runger, 2003] Montgomery, D. C. and Runger, G. C.


(2003).
Probabilidad y Estadı́stica aplicada a la Ingenierı́a.
LIMUSA, S.A.
[Peck and Devore, 2011] Peck, R. and Devore, J. L. (2011).
Statistics: The exploration & analysis of data.
Cengage Learning.
[Triola, 2018] Triola, M. F. (2018).
Estadı́stica.
Pearson educación de México, S.A.

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II


GRACIAS

Mg. Yuri Juan Balcona Mamani 0009-0003-5314-7217 Estadı́stica II

También podría gustarte