Está en la página 1de 8

Prueba para Media de dos Poblaciones

Estadística
Heriberto Felizzola

Tabla de contenido
Prueba de hipótesis con respecto a los parámetros estadísticos de dos poblaciones..........1
Caso 5. Prueba para media de dos poblaciones distribuidas normal con varianza conocida
.............................................................................................................................................2
Gráficas comparativas.....................................................................................................2
Hipótesis..........................................................................................................................3
Estadístico de prueba......................................................................................................3
Región critica..................................................................................................................4
Valor P............................................................................................................................5
Ejercicio en clase caso 5.................................................................................................5
Caso 6. Prueba para media de dos poblaciones distribuidas normal con varianza
desconocida.........................................................................................................................6
Prueba t asumiendo igualdad de varianzas.....................................................................6
Prueba t asumiendo desigualdad de varianzas................................................................7
Ejercicio en clase. Caso 6...............................................................................................8

Prueba de hipótesis con respecto a los parámetros estadísticos de dos


poblaciones
Existen situaciones en las cuales se busca comparar los parámetros estadísticos de dos
poblaciones:
• Comparar la proporción de defectos de dos líneas de producción
• Comparar los tiempos de ciclo promedio de dos operarios
• Comparar la desviación estándar (precisión) de dos instrumentos de medición
• Comparar el lead time promedio (tiempo de entrega) de dos proveedores
Las hipótesis que se plantean en este tipo de problemas son:
H 0 :θ1=θ 2

Para la hipótesis alterna se pueden plantear una de las siguientes opciones:


H 1 : θ1 <θ2
H 1 : θ1 >θ2
H 1 : θ 1 ≠ θ2

Donde, θ1 y θ2 son los parámetros estadísticos de las poblaciones que se buscan comparar.

Caso 5. Prueba para media de dos poblaciones distribuidas normal con


varianza conocida
Ejemplo. Dos tipos de plástico son adecuados para que un fabricante de componentes
electrónicos los utilice. La resistencia a la rotura de este plástico es importante. Se sabe que
la resistencia a la rotura de los dos tipos de plásticos se distribuye normal con desviaciones
estándar σ 1=1.6 y σ 2=1.8. Se realizan 8 pruebas con cada tipo de plástico y se obtienen los
siguientes resultados de resistencia en psi.

Plástico 158 155 156 154 153 158 155 154


1
Plástico 159 156 158 162 159 160 159 163
2

Plantee las hipótesis que permitan tomar una decisión sobre la selección de alguno de los
dos materiales. Pruebe la hipótesis considerando un nivel de confianza del 95%.

Gráficas comparativas
Cuando se comparan los parámetros estadísticos de dos poblaciones a partir de datos
muestrales se recomienda un análisis previo a través de gráficos exploratorios como la
gráfica de valores individuales o los gráficos de caja:

Hipótesis
Con basen en el análisis gráfico es razonable querer confirmar si la resistencia promedio del
plástico 1 es inferior a la del plástico 2, esto es:
H 0 : μ1 ¿ μ2
H 1 :μ 1 ¿ μ2

Cuando se comparan las medias de dos posible es posible expresar estas hipótesis de la
siguiente forma:
H 0 : μ1−μ2=0
H 1 : μ1−μ2 <0

El valor que queda del lado derecho de la igualdad es la diferencia hipotética entre las
medias de las poblaciones. Esta diferencia puede ser cero o diferente de cero.

Estadístico de prueba
Para calcular el estadístico de prueba considere los siguientes supuestos:

1. X 11 , X 12 , ... , X 1 n es una muestra aleatoria de la población 1.


1

2. X 21 , X 22 , … , X 2 n es una muestra aleatoria de la población 2.


2

3. Las dos poblaciones representadas por X 1 y X 2 son independientes.

4. Ambas poblaciones son normales.

Un estimador puntual lógico de μ1−μ 2 es la diferencia de medias muestrales X́ 1 − X́ 2.


Basado en las propiedades de los valores esperados,

E ( X́ 1− X́ 2 ) =E ( X́ 1 ) −E ( X́ 2) =μ1−μ 2

La varianza de X́ 1 − X́ 2 es:

σ 21 σ 22
V ( X́ 1 − X́ 2 ) =V ( X́ 1 ) +V ( X́ 2) = +
n1 n2

Teniendo en cuenta estos supuestos se plantea un estadístico de prueba Z 0:

X́ 1− X́ 2−( μ1−μ2 )
Z 0=


2 2
σ1 σ2
+
n1 n2

A continuación, se presenta un resumen estadístico de las muestras de los plásticos 1 y 2:

Varianz Desv.
Plástico Promedio a Estandar n
Plástico 155.38 3.41 1.85 8
1
Plástico 159.50 4.86 2.20 8
2
Reemplazando los valores:
(155.38−159.50)−0
Z 0= =−4.944

√ 1.6 2 1.82
8
+
8

Región critica
Para determinar la región critica se utilizan los criterios establecidos en las pruebas de
hipótesis para una población. Como en este caso tenemos una prueba de cola izquierda la
región critica estará ubicada de este mismo lado con probabilidad α =0.05 . En este caso
−Z 0.05=−1.645.

Conclusión: dado que el Z 0 cae en la región critica se rechaza H 0, por tanto, se infiere que
la resistencia promedio del plástico 1 es inferior al plástico 2.

Valor P
Al igual que la región critica, para el valor P se utiliza la guía utilizada para el caso 1. En
este caso,
Valor P ¿ P(Z <Z 0 )
−7
¿ ¿ 4.28× 10
Observe que en este caso el valor P es significativamente bajo con respecto al α =0.05 , por
tanto, hay una probabilidad muy baja de equivocarse al rechazar la hipótesis nula. Por
tanto, hay una confianza alta al afirmar la resistencia promedio del plástico 1 es inferior a la
del plástico 2.

Ejercicio en clase caso 5


Se están estudiando las velocidades de combustión de dos propulsores de combustible
sólido diferentes utilizados en los sistemas de escape de la tripulación aérea. Se sabe que
ambos propulsores tienen aproximadamente la misma desviación estándar de la velocidad
de combustión, es decir, σ 1=σ 2=3 centimetros por segundo . Se ensayan dos muestras
aleatorias de n1 =20 y n2 =18 especímenes; las velocidades promedio de combustión de las
muestras son X́ 1 =18 centimetros por segundo y X́ 2 =24 centimetros por segundo. Pruebe
la hipótesis de que ambos propulsores tienen la misma velocidad media de combustión.
Utilice α =0.05 . ¿Cuál es el valor P?
Hipótesis: plantee las hipótesis adecuadas
H0 :
H1 :

Estadístico de prueba:
X́ 1− X́ 2−( μ1−μ2 )
Z 0= =¿


2 2
σ1 σ2
+
n1 n2

Región critica:

Valor P:
Valor P=¿

Conclusión:

Caso 6. Prueba para media de dos poblaciones distribuidas normal con


varianza desconocida
Consideramos ahora las pruebas de hipótesis sobre la diferencia de medias μ1−μ 2 de dos
distribuciones normales donde las varianzas σ 21 y σ 22 son desconocidas. Para probar esta
hipótesis se utilizará un estadístico t-student con v grados de libertad.
Como se ha señalado anteriormente, el supuesto de normalidad es necesario para
desarrollar el procedimiento de prueba, pero las desviaciones moderadas de la normalidad
no afectan negativamente al procedimiento.
Hay que tratar dos situaciones diferentes:
1. En el primer caso, suponemos que las varianzas de las dos distribuciones normales
son desconocidas pero iguales; es decir, σ 21=σ 22 =σ 2.

2. En el segundo, suponemos que σ 21 y σ 22 son desconocidas y no necesariamente


iguales.

Prueba t asumiendo igualdad de varianzas

En la prueba t cuando se asume igualdad de varianzas σ 21=σ 22, el estadístico de prueba es,
( X́ 1− X́ 2 )−( μ 1−μ2)
t 0=
Sp
√ 1 1
+
n1 n2

Donde,

Sp=

(n 1−1) S 21 +(n2−1)S22
n1 +n 2−2

La prueba tiene v=n1 +n2 −2 grados de liberdad. Ademas, S p es la desviación estándar


conjunta estimada para las dos muestras. Retomando el ejemplo:

S p=
√ (8−1)3.41+(8−1) 4.86
8+8−2
=2.033

El estadístico de prueba es:


(155.38−159.50)−0
t 0= =−4.053
2.033
1 1
+
8 8√
Recuerde que tenemos una prueba de cola izquierda, por tanto, la región esta a la izquierda
de −t α ,v , para este caso un valor t con α =0.05 y v=14 grados de libertad.

Observe que el t 0 cae en la región critica, por tanto, se rechaza la hipótesis nula. El valor P
para esta prueba se calcula igual que en el caso, la única diferencia es que los grados de
libertada es v=n1 +n2 −2. Por tanto, el valor P para esta prueba es:
Valor P=P (t v=14 <t 0 )=P(t v=14 ←4.053)=0.00059

Como el valor P es menor a 0.05, entonces se rechaza la hipótesis nula. Observe que este
valor P es un poco mas alto que en el caso 5, lo cual se debe a que las desviaciones estándar
calculadas en la muestra son mas altas a las reportadas en el enunciado del problema.

Prueba t asumiendo desigualdad de varianzas


Cuando se asumen que las varianzas de las muestras son desiguales, entonces el estadístico
de prueba se calcula de la siguiente manera:
( X́ 1− X́ 2 )−( μ 1−μ2)
t 0=

√ S 21 S22
+
n 1 n2

Por otro lado, los grados de libertad v se calculan con la siguiente formula:

( )
2 2 2
s 1 s2
+
n1 n2
v= 2 2
( s 21 /n 1) ( s22 /n2 )
+
n1−1 n2−1

El resto del procedimiento para la región critica y el calculo del valor P es igual al caso
cuando se asume que las varianzas son iguales.

Ejercicio en clase. Caso 6


Una compañía de transporte de carga desea escoger la mejor ruta para llevar la mercancía
de un depósito a otro. La mayor preocupación es el tiempo de viaje. En el estudio se
seleccionaron al azar 7 choferes de un grupo de 14 y se asignaron a la ruta A; los 7
restantes se asignaron a la ruta B. Los datos obtenidos fueron:

Ruta Ruta
A B
26 18
29 24
34 30
25 21
35 26
30 23
34 33

a) Realice la gráfica de valores individuales y la gráfica de caja para comparar los


tiempos de las dos rutas. ¿Que puede concluir?
b) Presente las estadísticas descriptivas para cada ruta.

Estadística Ruta A Ruta B


Promedio

Varianza

Desviación Estándar

Tamaño de muestra - n
c) Plantee las hipótesis que permitan confirmar la selección de la mejor ruta. Pruebe
las hipótesis utilizando niveles de confianza del 90%, 95% y 99%.
Hipótesis: plantee las hipótesis adecuadas
H0 :
H1 :

Estadístico de prueba: recuerde que primero se debe calcular la desviación estándar


conjunta S p :


2 2
(n 1−1)S 1 +( n2−1) S2
Sp= =¿
n1 +n 2−2

Ahora calcule el estadístico de prueba:


( X́ 1− X́ 2 )−(μ 1−μ2)
t 0= =¿
Sp
√ 1 1
+
n1 n2

Región critica: determine la región critica para los diferentes niveles de confianza:

Nivel de Región Conclusió


Confianza critica n
90%

95%

99%

Valor P: determine el valor y compare con los diferentes valores de α :

Nivel de
α Valor P Conclusión
Confianza
90%

95%

99%

También podría gustarte