Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad 3. Estad°stica Inferencial para Dos Poblaciones PDF
Unidad 3. Estad°stica Inferencial para Dos Poblaciones PDF
3er semestre
Clave:
LIC 01142315 / TSU 02142315
Presentación de la unidad
Propósitos
En las unidades anteriores se estudió la manera de realizar una prueba de hipótesis para
una media poblacional y para una proporción poblacional. Ahora se mostrará la forma de
realizar una estimación por intervalo y realizar pruebas de hipótesis cuando se tienen dos
poblaciones, y lo que interesa es la diferencia entre dos medias poblacionales o la
diferencia entre dos proporciones poblacionales.
Este tipo de problema es mucho más frecuente en la vida real, puesto que en muchas
ocasiones lo que interesa es hacer un comparativo entre las medias. Por ejemplo, si se
desea tomar la decisión sobre el tipo o marca de lámparas que un municipio debe comprar,
se pueden comparar las vidas medias de cada tipo de lámpara para decidir.
Si se hiciera una gran cantidad de muestreos para cada uno de los dos tipos de lámparas,
se obtuvieran las medias de cada una de las muestras y después se hicieran las
__ __
diferencias de estas por pares, por ejemplo x1 x2 , puede observarse que la distribución
así formada se comporta de manera normal, por tal razón es que resulta posible darle un
tratamiento parecido a lo hecho anteriormente.
Para hacer una inferencia acerca de la diferencia de las medias de dos poblaciones, se
Para estimar la diferencia entre dos medias poblaciones 1 2 se toma una muestra
aleatoria simple de n1 elementos de la población 1 y una muestra aleatoria simple de n2
elementos de la población 2, y se calculan las dos medias muestrales:
__
Sea x1 la media obtenida de la muestra aleatoria simple de tamaño n1 .
__
Sea x2 la media obtenida de la muestra aleatoria simple de tamaño n2 .
Si ambas poblaciones tienen distribución normal o si los tamaños de las muestras son
suficientemente grandes, por el teorema del límite central se sabe que las distribuciones
__ __
muestrales de x1 y x2 pueden ser aproximadas mediante una distribución normal, de
__ __
manera que la distribución muestral de x1 x2 tendrá una distribución normal cuya media
__ __
12 22
es 1 2 y una varianza dada por 2
n1 n2
La estimación por intervalo de la diferencia entre las dos medias poblacionales es:
__ __ 12 22 __ __ 12 22
x1 x2 z 1 2 x1 x2 z
2 n1 n2 2 n1 n2
Ejemplo (1). Cierta cadena de tiendas de autoservicio tiene dos tiendas, una en la
De acuerdo con datos de estudios anteriores sobre los clientes, se sabe que
las desviaciones estándar poblacionales de cada una de las tiendas son
1 9 años y 2 10 años .
T1 T2
Tamaño de la muestra n1 36 n2 49
__ __
Media muestral x1 40 años x1 35 años
__ __ 12 22 __ __ 12 22
x1 x2 z 1 2 x1 x2 z
2 n1 n2 2 n1 n2
Cuando no se conocen las varianzas de las poblaciones, tanto en las estimaciones por
intervalo como en las pruebas de hipótesis, se emplea la distribución t de Student en lugar
de la distribución normal estándar; es decir, lo que debe hacerse es remplazar las z por t
en la fórmula ya conocida:
__ __ 12 22 __ __ 12 22
x1 x2 z 1 2 x1 x2 z
2 n1 n2 2 n1 n2
__ __ 12 22 __ __ 12 22
x1 x2 t , n n 2 1 2 x1 x2 t
2 1 2 n1 n2 2 , n1 n2 2 n1 n2
Sin embargo, no es posible realizar las estimaciones con la fórmula anterior, pues aún se
deben considerar dos situaciones que se resuelven de manera diferente:
Generalmente, cuando se estudia una población no se conocen sus parámetros y por ello
se toman muestras para estimarlos. En algunos casos se llega a observar que las
varianzas de dos poblaciones son muy parecidas, motivo por el que, aun siendo
desconocidas, se infiere que son iguales y a partir de esa inferencia se estima el intervalo
de confianza para la diferencia de las medias usando la siguiente expresión:
__ __ 1 1 __ __ 1 1
x1 x2 t , n n 2 s p 1 2 x1 x2 t sp
2 1 2 n1 n2 2 , n1 n2 2 n1 n2
s 2p
n1 1 s12 n2 1 s22
n1 n2 2
Ejemplo (2). Un fabricante de neumáticos asegura que la vida media de sus productos
excede en más 1,000 km la vida media de los neumáticos de uno de sus
competidores. Para contrastar la afirmación, con un nivel de confianza del
95%, se probaron nueve neumáticos del fabricante y siete de su competidor.
En la tabla se muestran la duración de los neumáticos para ambos
muestreos, en miles de kilómetros:
Fabricante 66.4 61.6 60.5 59.1 63.6 61.4 62.5 64.4 60.7
Competidor 58.2 60.4 55.2 62.0 57.3 58.7 56.1
9 1
1
5.03
5.61
Y al mismo tiempo
Por tanto:
3.97 2.484 1 2 3.97 2.484
1.486 1 2 6.454
5) Estadística t , n1 n2 2
__
6) Datos x1 62,200 km , s1 2,240 km
__
x2 58,270 km , s2 2,370 km
t0
62 .2 58 .27 1 2.529
7) Estandarización
2.2987 1 1
9 7
Valor crítico t 1.76
Tal y como se esperaba, las conclusiones obtenidas con ambas metodologías son las
mismas.
n1 1 n1 n2 1 n2
Tamaño de la muestra n1 28 n2 22
__ __
Media muestral x1 $1,025 x1 $910
Desviación estándar muestral s1 $150 s2 $125
2
150 2 125 2
28 22
v 2 2
47 .8
1 150 2 1 125 2
28 1 28 22 1 22
H 0 : p1 p2 0
H1 : p1 p2 0
H 0 : p1 p2 0
H1 : p1 p2 0
H 0 : p1 p2 0
H1 : p1 p2 0
Puede apreciarse que en todas las hipótesis consideradas se usa el cero como la
diferencia de interés; por ejemplo, si se supone que H 0 , considerada como igualdad, es
Ejemplo (5). Una compañía de perfumes desea comercializar una nueva fragancia, por
lo que su departamento de mercadotecnia debe saber si hay diferencia en
las proporciones de mujeres jóvenes y mayores que comprarían el perfume.
Se muestrean dos poblaciones independientes: mujeres jóvenes y mujeres
mayores y se consideran un nivel de confianza del 95%.
Solución: siguiendo los pasos descritos con anterioridad para la prueba de hipótesis:
1) Parámetro proporciones poblacionales p1 y p2
2) Hipótesis nula H 0 : p1 p2 0
3) Hipótesis alternativa H1 : p1 p2 0
4) Nivel de significancia 0.05
Probabilidad del 0.95
95% de confianza
5) Estadística z
2
____
19
6) Datos p1 0.19
100
____
62
p2 0.31
200
___
p
100 0.19 200 0.31 0.27
100 200
z0 2.2069
Valor crítico z 1.96
2
____ ____ __
__ 1 1
p1 p2 z0 p 1 p
n1 n2
1 1
0.19 0.31 1.96 0.27 1 0.27 p1 p2
100 200
Y al mismo tiempo:
1 1
p1 p2 0.19 0.31 1.96 0.27 1 0.27
100 200
Por tanto:
0.12 0.1065 p1 p2 0.12 0.1065
0.226 p1 p2 0.013
De aquí puede verse que la proporción de la primera población (mujeres jóvenes) siempre
será menor que la proporción de mujeres mayores; este resultado es consistente con lo
que se concluyó en el ejemplo 5.
Autoevaluación
Cierre de la unidad
Fuentes de consulta
Fuentes digitales
(s. a.). (s. f.). Pruebas de hipótesis para la media con muestra grande. Recuperado de
http://marcelrzm.comxa.com/EstadisticaInf/