Está en la página 1de 48

PRUEBA DE HIPÓTESIS DE DOS

POBLACIONES

ESTADISTICA II (Prof. en Matemática)


Ciclo II 2019
Mtra. Karla María Mejía Ortiz
CONTENIDO
 Prueba de hipótesis sobre la diferencia
entre las medias de dos poblaciones:
muestras grandes
 Prueba de hipótesis sobre la diferencia
entre las medias de dos poblaciones:
muestras pequeñas
 Prueba de hipótesis sobre la diferencia
entre las proporciones de dos
poblaciones
PRUEBA DE HIPÓTESIS PARA LAS
MUESTRAS DE DOS POBLACIONES

 Por lo general, en la práctica ocurre con


frecuencia la comparación de dos
poblaciones.
 Para tomar decisiones, se necesita
determinar si los parámetros de dos
poblaciones son iguales o diferentes.
 En ocasiones, el objetivo del analista es
evaluar una aseveración sobre una
diferencia específica entre las medias o
proporciones de dos poblaciones.
PRUEBA DE HIPÓTESIS PARA LAS
MUESTRAS DE DOS POBLACIONES

Por ejemplo:
 Una empresa puede tener la intención de
probar si sus empleadas reciben un salario
menor que el de sus empleados varones por
realizar el mismo trabajo.
 Un fabricante de medicinas puede tener la
necesidad de saber si un nuevo medicamento
ocasiona una reacción en un grupo de
animales para experimentación y otra
reacción distinta en otro grupo.
 En cada uno de los ejemplos anteriores, los que
toman decisiones están interesados en los
parámetros de dos poblaciones; no están tan
preocupados por el valor real de los parámetros
como de la relación entre sus valores; es decir
cuales son las diferencias.
 ¿Las empleadas ganan menos que los
empleados por hacer el mismo trabajo?
 ¿Un grupo de animales para
experimentación reacciona de manera
diferente que otro grupo?
 Para dar respuesta a estas preguntas, se utilizan
procedimientos de prueba de hipótesis de dos
muestras.
PRUEBA DE HIPÓTESIS SOBRE LA DIFERENCIA
ENTRE LAS MEDIAS DE DOS POBLACIONES:
MUESTRAS GRANDES

 Cuando se prueba la igualdad de las


medias de dos poblaciones, la hipótesis
nula afirma que las medias de las dos
poblaciones son iguales.
 Esta hipótesis no se descartará a menos
que se reúna suficiente evidencia para
rechazarla con una probabilidad de error
pequeña.
 La hipótesis alternativa puede usar el
signo desigual, mayor que o menor que.
 Esta elección depende de la afirmación que se
haga sobre las poblaciones de interés.
 Para una prueba de dos colas, la hipótesis nula y
alternativa son:
𝐻0 : 𝜇1 − 𝜇2 = 0
𝐻1 : 𝜇1 − 𝜇2 ≠ 0
 Para una prueba de una cola, la hipótesis nula y
alternativa se establecen como uno de los dos
grupos siguientes:
𝐻0 : 𝜇1 − 𝜇2 ≤ 0
𝐻1 : 𝜇1 − 𝜇2 > 0 ó

𝐻0 : 𝜇1 − 𝜇2 ≥ 0
𝐻1 : 𝜇1 − 𝜇2 < 0
 Observe que el valor 0 (cero) se puede sustituir por
cualquier valor de interés.
 Por ejemplo: 𝐻0 : 𝜇1 − 𝜇2 = 5
𝐻1 : 𝜇1 − 𝜇2 ≠ 5
 Las muestras independientes se eligen a partir de dos
poblaciones, y las observaciones que forman una muestra
se escogen en forma independiente de las observaciones que
constituyen la otra muestra.
 Una vez obtenidas las muestras aleatorias de cada
población, se calculan las medias muestrales y las
diferencias entre ellas.
 Esta diferencia es el estadístico de prueba que usa para
rechazar o no la hipótesis nula 𝐻0 .
 Si esta diferencia es grande, la hipótesis nula 𝐻0 se
rechaza.
 Si esta diferencia es pequeña, la hipótesis nula 𝐻0 no se
rechaza.
 Para determinar si la diferencia entre las
medias de las muestras es pequeña o
grande se calcula la distribución muestral
para este estadístico.
 Las especificaciones de esta distribución
dependen de los dos tamaños de las
muestras y de las varianzas de sus
poblaciones.
 Casi siempre se desconocen las varianzas
poblacionales, por lo general se usan las
varianzas muestrales como estimación.
 La distribución adecuada para esta
prueba es la distribución muestral de la
diferencia entre las medias muestrales.
 La media de la distribución muestral de la
diferencia entre las medias muestrales es:
𝜇𝑥ҧ1 −𝑥ҧ2
 La desviación estándar de la distribución
muestral de la diferencia entre las medias
muestrales se le llama error estándar de las
diferencias entre las medias.
 Se calcula usando la fórmula siguiente:

𝜎12 𝜎22
𝜎𝑥ҧ1 −𝑥ҧ2 = +
𝑛1 𝑛2
Error estándar de la diferencia entre las medias muestrales
Varianza de la población 1
Varianza de la población 2 Tamaño de la muestra 1
Tamaño de la muestra 2
 Si las varianzas poblacionales no se
conocen, se usan las varianzas muestrales
para estimarlas.
 Se calcula usando la fórmula siguiente:

𝑠 21 𝑠22
𝑆𝑥ҧ1−𝑥ҧ2 = +
𝑛1 𝑛2
Error
estándar Varianza de la
estimado de muestra 1
las diferencias Varianza de la
entre las muestra 1
medias
muestrales
PRUEBA PARA DIFERENCIAS ENTRE
MEDIAS: MUESTRAS GRANDES

 La distribución muestral para las


diferencias de las medias para muestras
grandes ( 𝑛 ≥ 30 ) es la distribución
normal. Las diferencias de las medias
muestrales se concentran alrededor de
Distribución cero.
muestral para las
diferencias de las
medias muestrales

𝜇𝑥ҧ1 −𝑥ҧ2 𝑥ҧ1 − 𝑥ҧ2


𝜇1 − 𝜇2 = 0
HIPÓTESIS
𝐻0 : 𝜇1 − 𝜇2 = 0 prueba de dos colas
𝐻1 : 𝜇1 − 𝜇2 ≠ 0

Pruebas de una cola


𝐻0 cierta

𝐻0 : 𝜇1 − 𝜇2 ≤ 0
𝐻1 : 𝜇1 − 𝜇2 > 0
𝑥ҧ1 − 𝑥ҧ2
𝐻0 : 𝜇1 − 𝜇2 ≥ 0 • Si la diferencia entre las medias de las muestras
es cercana a cero, lo que es probable si las dos
𝐻1 : 𝜇1 − 𝜇2 < 0 poblaciones tienen la misma media, la hipótesis
nula no se rechaza.
• Si se encuentra una gran diferencia, la hipótesis
nula se rechaza.
2 2
ESTADÍSTICO DE PRUEBA
 Elestadístico de prueba para probar la
media con dos poblaciones es un valor z,
ya que la distribución muestral es normal.
𝑥ҧ1 − 𝑥ҧ2 − 𝜇1 − 𝜇2
𝑧=
𝜎𝑥ҧ1 −𝑥ҧ2
 El valor z mide el número de errores
estándar entre 0, la media de la curva y la
diferencia entre las dos medias
muestrales.
USO DE LA NORMAL
 El uso de la distribución normal se basa en la
siguientes suposiciones:
1) las observaciones de las dos muestras son
independientes.
2) los tamaños de las muestras son ambos
30 o mayores. (𝑛1 , 𝑛2 ≥ 30)
 Si se usan tamaños de muestras menores que 30,
deberá suponerse que las poblaciones siguen una
distribución normal.
 Como se ha supuesto que la diferencia entre las
medias poblacionales es 0, en la ecuación z
anterior se omite el término 𝜇1 − 𝜇2 ; queda así:
𝑥ҧ1 − 𝑥ҧ2
𝑧=
𝜎𝑥ҧ1 −𝑥ҧ2
EJEMPLO

A un especialista en estadística que estudia


el desarrollo de recursos humanos se le pide
que determine si los salarios por hora de los
obreros semicalificados son los mismos en
dos ciudades distintas. El resultado de esta
investigación se presenta en la tabla
siguiente. Suponga que la empresa desea
probar la hipótesis al nivel de significancia
de 0.05 de que no hay diferencia entre los
salarios por hora de los trabajadores
semicalificados de las dos ciudades.
Datos de una encuesta con muestreo de salarios por hora

Salarios Desviación
medios por estándar de Tamaño de la
Ciudad
hora de la la muestra muestra (n)
muestra (𝑥)ҧ (𝑠)

Apex $ 8.95 $ 0.40 200


Eden $ 9.10 $ 0.60 175
EJEMPLO

 Gene Marsh, el administrador de un gran centro


comercial, está muy interesado en los resultados
de un estudio publicado en una revista. El
estudio probaba si los clientes obesos
experimentaban una espera más larga para que
los atendiera un vendedor que los clientes
delgados. Se reunieron observaciones durante
intervalos de 15 minutos en cuatro tardes de
sábado consecutivos, en dos zapaterías distintas
en un centro comercial urbano. Se clasificaron un
total de 181 clientes entre obesos y delgados y se
registro el tiempo promedio que tardaban los
vendedores en atenderlos.
Los resultados de la muestra son:

Desviación
Tiempo
estándar de Tamaño de la
Clientes medio de la
la muestra muestra (n)
respuesta (𝑥)ҧ
(𝑠)

Delgados 𝑥ҧ1 = 16.6 𝑠𝑒𝑔 𝑠1 = 11.6 𝑠𝑒𝑔 106


Obesos 𝑥ҧ2 = 29.7 𝑠𝑒𝑔 𝑠2 = 18.6 𝑠𝑒𝑔 75
Total 181

Con un nivel de significancia de 0.10, realizar una


prueba de hipótesis.
PRUEBA DE HIPÓTESIS SOBRE LA DIFERENCIA
ENTRE LAS MEDIAS DE DOS POBLACIONES:
MUESTRAS PEQUEÑAS

A veces los analistas deben probar la


diferencia entre las medias de dos
poblaciones usando muestras pequeñas.
 La prueba es igual que la de las medias de
dos poblaciones para muestras grandes,
aunque se usara la distribución t en
lugar de la curva normal.
 La distribución t se considera apropiada
cuando cualquier tamaño de muestra es
menor que 30.
USO DE LA DISTRIBUCIÓN T
 El uso de la distribución t supone que:
1) Las observaciones de las dos muestras son
independientes.
2) Las dos poblaciones son aproximadamente
normales.
3) Las dos poblaciones tienen varianzas
iguales.
ERROR ESTÁNDAR DE LA DIFERENCIA
ENTRE LAS MEDIAS DE DOS POBLACIONES

 Como se supone que las dos poblaciones


tienen varianzas iguales 𝜎12 = 𝜎22 entonces
se puede escribir el error estándar de la
diferencia entre las medias de dos
poblaciones como:
𝜎12 𝜎12 1 1
𝜎𝑥ҧ1 −𝑥ҧ2 = + 𝜎𝑥ҧ1 −𝑥ҧ2 = 𝜎. +
𝑛1 𝑛2 𝑛1 𝑛2
Las desviaciones estándar de las dos
muestras se agrupan para formar un solo
estimado de la desviación estándar
poblacional desconocida.
ERROR ESTÁNDAR DE LA DIFERENCIA
ENTRE LAS MEDIAS DE DOS POBLACIONES

 En esencia, calculamos una media ponderada de


las desviaciones estándar de las dos muestras y
la usamos cómo un estimado de la desviación
estándar poblacional.
 Las ponderaciones son los grados de libertad que
ofrece cada muestra.
ESTIMACION COMBINADA DE LA VARIANZA
¿Por qué necesitamos agrupar las desviaciones
estándar?
En la mayoría de los casos, cuando cada una de las
muestras tiene menos de 30 observaciones, las
desviaciones estándar poblacionales de desconocen.
Por lo tanto, calculamos s, la desviación estándar
muestral, y la sustituimos por 𝜎, la desviación estándar
poblacional.
 Como suponemos que las dos poblaciones tienen
desviaciones estándar iguales, el mejor estimado
que podemos hacer de este valor es combinar o
agrupar toda la información que tenemos acerca
del valor de la desviación estándar poblacional.
2
 Si no se conoce la varianza, 𝜎 , se pueden usar
las dos varianzas muestrales para calcular una
estimación combinada de la varianza,
también se conoce como Estimación conjunta de
𝜎2 .
 Varianza combinada:

𝑛1 −1 𝑠12 + 𝑛2 −1 𝑠22
𝑆 p2 =
𝑛1 +𝑛2 −2
 Error estándar estimado de la diferencia
entre dos medias muestrales, con muestras
pequeñas y varianzas de población iguales:
1 1
𝑆𝑥ҧ1 −𝑥ҧ2 = 𝑆𝑝 +
𝑛1 𝑛2
𝑥ҧ 1 −𝑥ҧ 2 𝑥ҧ 1 −𝑥ҧ 2
El valor t de prueba : 𝑡 = 𝑜 𝑡=
𝑆𝑥ഥ1 −𝑥ഥ2 1 1
𝑆𝑝2 𝑛 +𝑛
1 2

La hipótesis nula que se quiere probar es que


las dos poblaciones de donde se tomaron las
muestras tienen la misma media. Bajo la
suposición de que esta hipótesis es cierta, el
estadístico muestral se calcula mediante la
ecuación anterior de t. Así,
Después se elige el nivel de significancia y se
consulta la tabla t para obtener el valor crítico de
prueba, donde el número de grados de libertad es
𝑔𝑙 = 𝑛1 + 𝑛2 − 2
 Regla de decisión
- Si el estadístico de prueba es menor (o
mayor) que el valor critico, se rechaza
la hipótesis nula.
- Si el valor absoluto del estadístico de
prueba es mayor que el valor critico, la
hipótesis nula se rechaza al nivel de
significancia elegido.

𝑅 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑇: 𝑇 < 𝑡𝑔𝑙,𝛼 𝑇: 𝑇 > 𝑡𝑔𝑙,1−𝛼 ቄ𝑇: 𝑇 >


APLICACIÓN
El gerente de producción de Bellevue Steel,
fabricante de sillas de ruedas, quiere comparar
el número de sillas de ruedas defectuosas
producidas en el turno diurno con el del turno
vespertino. Una muestra de la producción de 6
turnos diurnos y 8 vespertinos reveló los
siguientes números de defectos.
Diurno 5 8 7 6 9 7
Vespertino 8 10 7 11 9 12 14 9
Con un nivel de significancia de 0.05, ¿hay
alguna diferencia en el número medio de
defectos por turno?
SOLUCIÓN
𝐻0 : 𝜇𝑑 = 𝜇𝑣
𝐻1 : 𝜇𝑑 ≠ 𝜇𝑣
42 10
𝑥ҧ𝑑 = =7 𝑠𝑑 = = 1.4142
6 6−1
80 36
𝑥ҧ𝑣 = = 10 𝑠𝑣 = = 2.2678
8 8−1

2 + 8 − 1 2.2678 2
6 − 1 1.4142
𝑆𝑝2 = = 3.8333
6+8−2
7 − 10
𝑡= = −2.837
1 1
3.8333 +
6 8
CONT. SOLUCIÓN

 𝑔𝑙 = 6 + 8 − 2 = 12
 Valores críticos: ±2.179
 Regla de decisión: Rechazar 𝐻0 si t es menor a
-2.179 o si t es mayor a 2.179
 Tomar una decisión:
Rechazar 𝐻0 porque -2.837 es menor que el valor
crítico de -2.179. Por lo que el número medio de
defectos no es igual en los dos turnos.

Las suposiciones necesarias para esta prueba


son: poblaciones independientes, las poblaciones
siguen la distribución normal, las poblaciones
tienen la misma desviación estándar.
EJERCICIO

 Una muestra de las calificaciones obtenidas


en un examen de Estadística II es:

Hombres 72 69 98 66 85 76 79 80 77
Mujeres 81 67 90 78 81 80 76

Con un nivel de significancia de 0.01 ¿la


calificación media de las mujeres es más alta
que aquella de los hombres?
PRUEBAS DE HIPÓTESIS DE DOS
MUESTRAS: MUESTRAS DEPENDIENTES

 Hay situaciones en las que las muestras no


son independientes. En otras palabras, las
muestras son dependientes o están
relacionadas.
Datos pareados
Se originan cuando cada valor de los datos en
una muestra se relaciona con el valor
correspondiente en otra muestra.
 En las pruebas de datos pareados, no hay
necesidad de suponer que las dos poblaciones
de que se trata tienen varianzas iguales.
 La única suposición necesaria es que la
población de diferencias sea normal.
 Con muestras dependientes, se sigue el
procedimiento básico adoptado en todas las
pruebas de hipótesis.
 La única diferencia consiste en que se emplea
una fórmula distinta para el error estándar
estimado de las diferencias muestrales y que
es necesario que ambas muestras sean del
mismo tamaño.
 Se usarán las ecuaciones: Estadístico de
σ𝑑
ҧ
𝑑= prueba
𝑛
𝑑ҧ
2 σ𝑑 2 𝑡=
σ 𝑑−𝑑ത 2 σ𝑑 −
𝑛 𝑆𝑑
𝑆𝑑 = = ൘
𝑛−1 𝑛−1 𝑛
donde :
𝑑ҧ : diferencia promedio entre las observaciones
pareadas
𝑑 : diferencia de los datos pareados
𝑆𝑑 : desviación estándar de las diferencias
𝑛 : número de diferencias

Grados de libertad= 𝑛 − 1
CUANDO USAR MUESTRAS DEPENDIENTES
 Hay dos tipos de muestras dependientes:
1. El primer tipo de muestra dependiente se
caracteriza por una medición seguida por
una intervención de algún tipo y luego otra
medición. Éste se podría considerar un
estudio de «antes» y «después».
2. El segundo tipo de muestra dependiente se
caracteriza por una comparación o
combinación de las observaciones por pares.
APLICACIÓN
 La publicidad realizada por Sylph Fitness
Center afirma que al terminar su curso las
personas bajarán de peso. Una muestra
aleatoria de ocho participantes recientes
reveló los pesos siguientes antes y después
del curso. En el nivel de significancia de 0.01.
¿podemos llegar a la conclusión de que los
participantes bajan de peso?
Nombre A B C D E F G H
Antes 155 228 141 162 211 164 184 172
Después 154 207 147 157 196 150 170 165
SOLUCIÓN
𝜇1 ∶ 𝑝𝑒𝑠𝑜 𝑎𝑛𝑡𝑒𝑠
1) 𝐻0 : 𝜇𝑑 ≤ 0 𝜇2 ∶ 𝑝𝑒𝑠𝑜 despues
𝜇2 < 𝜇1 ó 𝜇1 > 𝜇2 , 𝜇1 − 𝜇2 > 0 , 𝜇𝑑 > 0
𝐻1 : 𝜇𝑑 > 0
2) 2
Nombre Antes Después 𝑑 𝑑 − 𝑑ҧ 𝑑 − 𝑑ҧ
A 155 154 1 -7.875 62.0156
B 228 207 21 12.125 147.0156
C 141 147 -6 -14.875 221.2656
D 162 157 5 -3.875 15.0156
E 211 196 15 6.125 37.5156
F 164 150 14 5.125 26.2656
G 184 170 14 5.125 26.2656
H 172 165 7 -1.875 3.5156
71 538.8750

ҧ 71 538.8750
𝑑 = = 8.875 𝑆𝑑 = = 8.774
8 8−1
3) Estadístico de prueba
8.875
𝑡 = 8.774 = 2.861
ൗ 8
4) Valor crítico: 𝑡𝑛−1,𝛼 = 𝑡7,0.01 = 2.998
5) Regla de decisión: Rechazar 𝐻0 si 𝑡 > 2.998
6) Tomar una decisión:
Como 𝑡 = 2.861 < 𝑡7,0.01 = 2.998 no se rechaza 𝐻0 .
No podemos llegar a la conclusión de que los
participantes del curso bajaron de peso.
7) 0.01 < 𝑣𝑎𝑙𝑜𝑟 𝑝 < 0.025
𝐻0 se
rechaza

𝐻0 no se 0.01
rechaza

t=2.998
EJERCICIO

 Una investigación sobre la efectividad de un jabón


antibacterial al reducir la contaminación en las
salas de operaciones dio como resultado la tabla
siguiente. El nuevo jabón se probó en una muestra
de ocho salas de operaciones en el área de Seattle
durante el último año.
Sala de operaciones
A B C D E F G H
Antes 6.6 6.5 9.0 10.3 11.2 8.1 6.3 11.6
Después 6.8 2.4 7.4 8.5 8.1 6.1 3.4 2.0

Con un nivel de significancia 0.05. ¿podemos llegar a


la conclusión de que los niveles de contaminación
se reducen después de usar el nuevo jabón?
Prueba de hipótesis para
proporciones de dos poblaciones
 Un analista puede querer comparar dos
poblaciones sobre la base de la proporción o
porcentaje de sus miembros que cumplen una
determinada condición.
 Para probar la diferencia entre dos proporciones
poblacionales se toma una muestra aleatoria de
cada población y se calcula la proporción muestral
de cada una.
 La diferencia entre las proporciones muestrales es
el estadístico de prueba, y su distribución muestral
es la distribución normal.
 Si se supone que la hipótesis nula es cierta, la
distribución muestral tendrá una media de cero,
que es la diferencia entre las proporciones de las
poblaciones.
 Las diferencias entre las proporciones muestrales
se concentran entonces alrededor de la media de
cero en una curva normal.
Distribución muestral
𝐻0 no se
de las diferencias entre
rechaza
proporciones
muestrales.
𝑃1 − 𝑃2 = 0 𝑝1 − 𝑝2 = 0
 Si la diferencia entre las proporciones muestrales
es cercana a cero, esto apoya la 𝐻0 de que las
proporciones tienen la misma proporción.
 Es este caso, la 𝐻0 no se rechaza.
 Si las muestras tienen proporciones muy
diferentes, la 𝐻0 se rechaza.
 En la prueba de hipótesis para proporciones con
dos muestras, la estimación combinada de la
proporción poblacional (𝑝)Ƹ se calcula con el
promedio de las proporciones de las dos
muestras:
𝑥1 +𝑥2
𝑝Ƹ = donde:
𝑛1 +𝑛2
𝑥1 : número de éxitos en la muestra 1
𝑥2 : número de éxitos en la muestra 2
𝑛1 : tamaño de la muestra 1
𝑛2 : tamaño de la muestra 2
Error estándar de la diferencia entre
proporciones poblacionales
Es la desviación estándar de la distribución
muestral de las diferencias entre todas las
proporciones muestrales posibles para tamaños de
1 1
muestras dados. 𝜎𝑝1 −𝑝2 = 𝑝Ƹ 1 − 𝑝Ƹ +
𝑛1 𝑛2

donde:
𝜎𝑝1−𝑝2 = estimación del error estándar de las
diferencias entre proporciones poblacionales
𝑝Ƹ = estimación combinada de la proporción
poblacional
𝑛1 = tamaño de muestra 1
𝑛2 = tamaño de muestra 2
El estadístico de prueba para la prueba de hipótesis
para dos proporciones es:
𝑝1 −𝑝2 − 𝑃1 −𝑃2 𝑝1 −𝑝2
𝑍= =
𝜎𝑝1 −𝑝2
ෝ 1+1
ෝ 1−𝑝
𝑝 𝑛 1 𝑛2
 La hipótesis nula que se está probando es que las
dos poblaciones de donde se obtuvieron las
muestras tienen la misma proporción.
 El estadístico de prueba muestral se compara
suponiendo que 𝐻0 es cierta. Se elige un nivel de
significancia y se consulta la tabla z para obtener el
valor crítico de la prueba.
 Regla de decisión:
- Si el estadístico de prueba es menor que este valor
Z crítico o mayor que –Z crítico, la 𝐻0 no se
rechaza.
- Si es mayor o menor que el valor crítico, 𝐻0 se
rechaza al nivel de significancia elegido.

También podría gustarte