Está en la página 1de 9

Unidad 3 / Escenario 5

Lectura Fundamental

Pruebas de hipótesis
para dos poblaciones

Contenido

1 Pruebas de hipótesis para dos poblaciones

2 Prueba de hipótesis para diferencias entre dos proporciones

Referencias

Palabras Claves: muestra, población, hipótesis, significancia.


1. Pruebas de hipótesis para dos poblaciones

Para comparar dos poblaciones podemos utilizar las pruebas de hipótesis y determinar si existen comportamientos
similares entre ellas, con base en las estimaciones que se hacen sobre una muestra tomada (por cada). Las más
comunes que se encontraran corresponden a la diferencia de medias, cociente de varianzas y cuando se hace sobre
una misma población para comparar si cambia después de hacer un experimento sobre ella, se denominan, pruebas
de hipótesis para muestras pareadas.

Empecemos, entonces, con la prueba para diferencia de medias.

1.1. Prueba de hipótesis para la diferencia de medias

1.1.1. Prueba de hipótesis para la diferencia de medias con varianzas poblacionales conocidas

Cuando tomamos dos muestras y conocemos la varianza de la población de la que provienen cada una de ellas
entonces utilizamos nuevamente tres sistemas de hipótesis de la siguiente manera.

1. Prueba a cola izquierda:

H0 : µ1 − µ2 = δ0
vs
H1 : µ1 − µ2 < δ0

2. Prueba a cola derecha:


H0 : µ1 − µ2 = δ0
vs
H1 : µ1 − µ2 > δ0

3. Prueba a dos colas:


H0 : µ1 − µ2 = δ0
vs
H1 : µ1 − µ2 6= δ0

Para cada uno de esos sistemas se utiliza el siguiente estadı́stico de prueba.

(x¯1 − x¯2 ) − δ0
zc = q 2
σ1 σ22
n1 + n2

POLITÉCNICO GRANCOLOMBIANO 1
En este tipo de pruebas se pueden ver problemas como el siguiente.

Ejemplo
Se debe analizar si los jóvenes invierten más tiempo en ver videos de YouTube que series en Netflix, pues se cree
que ellos ven más tiempo Netflix. Los datos se presentan a continuación.

Tabla 1: Tiempo invertido en entretenimiento


Tiempo en minutos por dı́a
Youtube Netflix
n1 = 40 n2 = 45
x̄1 = 120 x̄2 = 115
σ1 = 10 σ2 = 12
Fuente elaboración propia

Paso 1: se plantea la hipótesis nula H0 de que no existe diferencia entre la cantidad de tiempo que los jovenes
invierten en ver videos en estas dos plataformas. La hipótesis alternativa se plantea en términos de que hay alguna
diferencia significativa entre los tiempos que ellos invierten en estas dos plataformas. Simbólicamente se expresa
ası́:

H0 : µ1 − µ2 = 0
vs
H1 : µ1 − µ2 > 0

Paso 2: se elige el nivel de significancia con que se va a juzgar la hipótesis, para este caso α = 0, 01.

Paso 3: se aplica el estadı́stico de prueba.

(120 − 145) − 0
zc = q = 2, 09
100 144
40 + 45
.

Paso 4: se calcula el valor del zα = z0,01 = 2, 32.

Paso 5: se compara zc = 2, 09 con z0,01 = 2, 32 para decidir, como 2, 09 < 2, 32 no existe evidencia para rechazar
la hipótesis nula.

1.1.2. Prueba de hipótesis para la diferencia de medias con varianzas poblacionales desconocidas. Muestras
grandes

Es muy común que cuando se quiere hacer comparación de dos grupos a través de las medias, no se conozcan las
varianzas poblacionales, para estos casos es posible obtener las medias muestrales x̄1 − x̄2 y las varianzas muestrales
S12 y S22 .

POLITÉCNICO GRANCOLOMBIANO 2
Si se supone que las muestras se obtienen de manera aleatoria e independiente a partir de las poblaciones respectivas
que tiene una distribución normal con varianzas poblacionales iguales, es decir, σ12 = σ22 , se puede utilizar una
prueba de distribución normal de varianzas combinadas para determinar si existe una diferencia significativa entre
las dos poblaciones.

Se debe recordar que para diferencias de medias se utiliza el siguiente estadı́stico de prueba:

(x¯1 − x¯2 ) − δ0
zc = q 2
s1 s22
n1 + n2

Ejemplo (Montgomery, 2002)

Una obra de construcción requiere un gran número de bloques de concreto. Dos empresas abastecedoras, A y B,
licitan para su adjudicación, y dentro del pliego de condiciones se estipula que la resistencia mı́nima es de 1.000
unidades métricas a la resistencia, y el contrato se adjudicará a la empresa que mayor resistencia presente su
producto.

Paso 1: se plantea la hipótesis nula H0 que no existe diferencia entre las resistencias medias a la compresión de los
bloques de concreto. La hipótesis alternativa se plantea en términos que hay alguna diferencia significativa entre
las dos resistencias medias a la compresión. Simbólicamente se expresa ası́:
H0 : µ1 = µ2

vs
H1 : µ1 6= µ2

Dado que la hipótesis alternativa no indica una dirección especı́fica, la prueba es de dos colas.

Paso 2: se elige un nivel de significancia de 0,01. Esto equivale a cometer un error de tipo I. Se usará una distribución
normal estandarizada Z, razón por la cual se debe seleccionar una muestra que contenga como mı́nimo 30 unidades
de bloques, de cada una de las empresas licitantes.

Paso 3: el estadı́stico de prueba a aplicar está dado por la siguiente fórmula:

(x¯1 − x¯2 ) − δ0
zc = q 2
s1 s22
n1 + n2

Se debe suponer que se seleccionó una muestra de cada una de las empresas licitantes y se determinó la resistencia
a la compresión, con los siguientes resultados.

Se quiere determinar para la construcción de un puente peatonal qué tipo de material se debe escoger. Para esto
hay dos proveedores de concreto y cada uno proporcionó 15 cilindros (de concreto) para saber cuál de los dos hará
la obra, los datos están en la siguiente tabla.

POLITÉCNICO GRANCOLOMBIANO 3
Tabla 2: Datos licitantes
Licitante A Licitante B
n1 = 81 n2 = 64
x̄1 = 1.070 x̄2 = 1020
s1 = 63 s2 = 57
Fuente elaboración propia

El valor del estadı́stico de prueba es:

(1070 − 1020) − 0
zc = q
632 2
812
+ 57
642
zc = 5, 01

Paso 4:el valor Z calculado queda en el área de rechazo de la hipótesis nula, por lo tanto se concluye que la media
poblacional de la resistencia a la compresión es diferente en las dos empresas y la diferencia no se debe al azar del
muestreo, con un nivel de significancia del 10 %.

1.2. Prueba para la diferencia de medias. Muestras pequeñas

Cuando se quiere probar la diferencia de medias con muestras pequeñas el procedimiento sufre algunos cambios ya
que en los casos en donde los tamaños de muestra eran mayores de 30 se estimaban las desviaciones estándar de
la población con las desviaciones de la muestra, pero para muestras pequeñas este procedimiento no es adecuado,
pues aquı́ se necesita estimar la varianza común.

Suponiendo que las varianzas de las poblaciones son iguales se utiliza la siguiente varianza ponderada o estimación
conjunta de la varianza.

(n1 − 1)S12 + (n2 − 1)S12


Sp2 =
n1 + n2 − 2

Como se tienen muestras pequeñas y no se conocen las varianzas de la población, se utiliza la distribución t con
grados de libertad (n1 + n2 − 2) que corresponden a las dos muestras.

Otra diferencia es la forma como se calcula el error estándar, para obtenerlo se usa la siguiente ecuación:

r
1 1
σ̂x¯1 −x¯2 = sp +
n1 n2

Ejemplo

El gerente de una entidad financiera quiere determinar si existen diferencias significativas en el tiempo de atención
de dos cajeros. Una muestra aleatoria de seis clientes atendidos por el cajero A y de ocho clientes atendidos por
el cajero B da los siguientes resultados (tiempo en minutos).

POLITÉCNICO GRANCOLOMBIANO 4
Cajero A: (5, 8, 7, 6, 9, 7)
Cajero B: (8, 10, 7, 11, 9, 12, 14, 9)

Paso 1: planteamiento de las hipótesis.

H0 : µ1 = µ2
vs
H1 : µ1 6= µ2

Paso 2:
análisis de las condiciones:
- Muestras pequeñas.
- Desviaciones estándar de la población desconocidas.

Entonces se trabaja con la distribución t


Se observa que n1 = 6 y n2 = 8 entonces los grados de libertad son:

Gl = 6 + 8 − 2 = 12

Paso 3: para un nivel de significancia α = 5 % se busca el valor de la tabla t con 14 gl.

Los valores crı́ticos son - 2,179 y 2,179.

Paso 4: se calcula el estadı́stico de prueba

(x¯1 − x¯2 ) − δ0
tc = q 2
s1 s22
n1 + n2

Se calcula la media y la desviación estándar para cada muestra, obteniendo:

Tabla 3: Cajeros
Cajero A Cajero B
x̄1 = 10 x̄2 = 10
s1 = 1.4142 s1 = 1.4142
Fuente elaboración propia

Primero calculamos la desviación estándar conjunta en donde:

(n1 − 1)s21 + (n2 − 1)s22


s2p =
n1 + n2 − 2

POLITÉCNICO GRANCOLOMBIANO 5
sp = 1, 9579

Y el error estándar

r
1 1
σ̂x¯1 −x¯2 = sp +
n1 n2

El valor calculado cae en la zona de rechazo, por lo tanto, la decisión es rechazar la hipótesis Ho. Con un nivel
de significancia del 5 % se puede decir que sı́ existen diferencias significativas en el tiempo de atención de los dos
cajeros.

2. Prueba de hipótesis para diferencias entre dos proporciones

Se presenta a continuación un ejemplo donde se emplea la prueba de proporción para la diferencia entre dos
poblaciones, utilizando el siguiente estadı́stico de prueba:

(pˆ1 − pˆ2 ) − π1 − π2
zc = q
pˆ1 (1−pˆ1 )
n1 + pˆ2 (1−
n2
pˆ2 )

Ejemplo (Gutiérrez, 2005):dos lotes de frutas conformados cada uno por 250 unidades son tratados y almacenados
en iguales condiciones, salvo que el lote No 1 está a temperatura ligeramente inferior que el lote No 2. Pasado un
tiempo se encuentra que el lote 1 hay 225 frutas sanas y en el lote 2 hay 200 sanas. Probar la hipótesis que la
temperatura más baja favorece la conservación de las frutas al nivel de significación de 0.05.

Paso 1:plantear la hipótesis.

H0 : π1 − π2 = δ0
vs
H1 : π1 − π2 > δ0

Paso 2:definir el nivel de significancia y calcular ese valor de z (valor crı́tico). Para este caso α = 0, 05 y zα = 1, 645.

Paso 3: calcular el valor del estadı́stico de prueba.

(0, 9 − 0, 8) − 0
zc = q = 3, 12
0,9(1−0,9) 0,8(1−0,8)
250 + 250

Paso 4: como el valor del estadı́stico de prueba zc = 3, 12 es mayor que el valor crı́tico zα = 1, 645, entonces se
rechaza H0 .

POLITÉCNICO GRANCOLOMBIANO 6
Referencias

[1] Montgomery, Douglas C and Runger Probabilidad y estadı́stica aplicadas a la ingenierı́a 1996.

[2] Walpole, Ronald E and Myers, Raymond H and Myers, Sharon L Probabilidad y estadı́stica para ingenieros
1999.

[3] Anderson, D.R. and Sweeney, D.J. Estadı́stica Para Administración y Economı́a 2008.

POLITÉCNICO GRANCOLOMBIANO 7
INFORMACIÓN TÉCNICA

Módulo: Estadı́stica II
Unidad 3: Pruebas de hipótesis con dos o más poblaciones
Escenario 5: Pruebas de hipótesis para dos poblaciones

Autor: Daniel Ernesto Santiago Garnica

Asesor Pedagógico: Diana Marcela Salcedo Dı́az


Diseñador Gráfico: Jully Amanda Guzman
Corrector de estilo: Felipe Garán
Asistente: Ginna Paola Quiroga

Este material pertenece al Politécnico Grancolombiano.


Por ende, es de uso exclusivo de las Instituciones
adscritas a la Red Ilumno. Prohibida su reproducción
total o parcial.

POLITÉCNICO GRANCOLOMBIANO 8

También podría gustarte