Está en la página 1de 14

Prueba de hipótesis para dos

poblaciones independientes
Estadística Inferencial
Grupo #1
Alcívar Sánchez Dayse
Pérez Cañote Juan
Poveda Martínez Nicole
Curso: 5-1

Docente:
Ing. Ingrid Sarmiento
Contenido
La estimación de
Teoría básica
intervalos entre dos
(Introducción)
poblaciones

Estimación de
intervalos con Pruebas de hipótesis
muestras grandes y con dos poblaciones
pequeñas

Ejercicios de
aplicación
En muchas situaciones de toma de decisiones, las personas
necesitan determinar si los parámetros de dos poblaciones son
Introducción
iguales o diferentes.

Ejemplos:
• Una empresa puede tener la intención de probar si sus empleadas
reciben un salario menor que el de sus empleados varones por
realizar el mismo trabajo.
• Un fabricante de medicinas desea saber si un nuevo medicamento
ocasiona una reacción en un grupo de animales para
experimentación y otra reacción distinta en otro grupo.
• Los trabajadores de una planta producen en promedio más que los
trabajadores de una segunda planta?

Se puede: construir una estimación por intervalo para la


diferencia entre dos medias poblacionales o probar la
hipótesis de que dos medias poblacionales son iguales.

El procedimiento dependerá de la técnica de muestreo que se


utilice, pueden ser: independientes o por pares. Y
comenzaremos a explicar el muestreo independiente.
Paso 1. Estimar diferencia
entre las medias µ1 - µ2

Depende del Muestras aleatorias simples


tamaño de las independientes.
muestras

Ya que muchas muestras diferentes


La distribución de las diferencias entre
pueden tomarse de cada población,
Si la muestra es resulta toda una distribución de
las medias muestrales es una
distribución centrada en (µ1 - µ2)
n ≥ 30 diferencias de estas medias muestrales.
La distribución normal Z puede
utilizarse para construir el intervalo.

No se puede asumir que la distribución


de las diferencias en las medias Se deberá determinar si las varianzas de
muestrales se ajusta a una distribución las dos poblaciones son iguales.
Si la muestra normal.
en n < 30 •Cuando las varianzas poblacionales
son desconocidas.
Se analizarán dos intervalos de
confianza cuando: 1) Se asume que las
•Se utilizará la distribución t. varianzas son iguales, 2) no se asume
que sean iguales.
Estimación con muestras grandes
1. Intervalo de
confianza para la
diferencia entre dos
medias poblacionales
𝐼.𝐶 𝑝𝑎𝑟𝑎 ( 𝜇1 −𝜇2 )=( 𝑋´ 1 − 𝑋´ 2)∓𝑍𝜎 𝑋´ − 𝑋´
 

1 2

 
Donde: es el error estándar de las
diferencias muestrales.
a. Siendo las
varianzas
 
𝜎 12 𝜎 22
poblacionales
conocidas 𝜎 𝑋´ 1
´2
−𝑋
=
√ 𝑛1
+
𝑛2

b. Siendo las 𝐼.𝐶 𝑝𝑎𝑟𝑎 ( 𝜇1 −𝜇2 ) =( 𝑋´ 1 − 𝑋´ 2)∓𝑍𝑠 𝑋´ − 𝑋´


 

1 2
varianzas
poblacionales
  2 2
𝑠1 𝑠2

desconocidas
𝑠 𝑋´ ´ 2
−𝑋
= +
1
𝑛1 𝑛2
Ejemplo 1:
 Transfer Trucking transporta remesas entre Chicago y Kansas City por dos rutas. Una muestra de 100 camiones enviados por la ruta del norte reveló
un tiempo promedio de tránsito de horas con una desviación estándar de horas, mientras que 75 camiones que utilizan la ruta del sur necesitaron un
promedio de horas con una desviación estándar de horas. Delmar, el despachador de Transfer Trucking, desea desarrollar un intervalo de confianza
del 95% para la diferencia en el tiempo promedio entre estas dos rutas alternas.

Al no
Al no tener
tener la
la desviación
desviación
estándar de
estándar de la
la población,
población,
Datos: Determinación de error
se procede
se procede concon la
la
estándar: muestral
muestral
Intervalo del 95% de confianza
Ruta Norte Ruta Sur
  2 2  − 𝟑 , 𝟕 ≤ ( 𝝁𝟏 − 𝝁𝟐 ) ≤ − 𝟎 , 𝟕𝟓

𝑠 𝑋´ − 𝑋´ =
1 2

(5,3) (4,5)
100
+
75
=0,742
Construcción de intervalo de
Interpretación:
Delmar puede tener un 95% de confianza en
que la ruta del sur se toma entre 0,75 horas y
Confianza del 95% confianza: 3,7 horas más.
Valor en tabla Z = 1,96

𝐼.𝐶 𝑝𝑎𝑟𝑎 ( 𝜇1 −𝜇2 )=(17,2−19,4)±(1,96)(0,742)


 

( 17,2−19,4 ) + ( 1,96 )( 0,742 ) ( 17,2−19,4 ) − ( 1,96 )( 0,742 )


Estimación con muestras pequeñas:
Distribución t

Varianza
Condiciones n≤30 poblacional
desconocida
Utilizada mayormente para los
procesos en línea, maquinarias
ajustables, donde se pueden ajustar
periódicamente para asegurar el nivel
promedio de uso.
Varianza
poblacional de
Se aplica si: ambas poblaciones
Pero, cómo?
son “iguales”

1. Asumiendo que 2. No se asume que


Se analizarán: las varianzas son las varianzas sean
iguales iguales.
Caso 1: Suponiendo que las varianzas
poblacionales son iguales pero desconocidas
Si ambas varianzas son FÓRMULAS
iguales, debe existir una • Es decir
varianza común en
Estimado mancomunado de la varianza común a
ambas poblaciones ambas poblaciones
 
2
𝑠12 ( 𝑛1 − 1 )+ 𝑠 22 ( 𝑛2 − 1 )
Debido al error de 𝑠𝑝 =
𝑛 1 + 𝑛2 − 2
muestreo, puede que • Si se toma una muestra de cada población,
exista una diferencia las dos varianzas de la muestra
entre ambas probablemente diferirán una de la otra.   Intervalo para la diferencia entre medias
poblacionales cuando
varianzas. desconocidas

  2 2
𝑠𝑝 𝑠𝑝
Los datos se pueden
mancomunar y
obtener un estimado
de
• Se calcula el promedio ponderado de las dos
varianzas de la muestra.
• Los pesos son los grados de libertad n-1 para
cada muestra.
𝐼 .𝐶 𝑝𝑎𝑟𝑎 ( 𝜇1 −𝜇2 ) =( 𝑋´ 1 − 𝑋´ 2)±𝑡 +

𝑛1 𝑛 2
Ejemplo 2:
 En la cafetería de los estudiantes, una máquina expendedora de bebidas dispensa bebidas en tazas de papel. Una muestra de 15 tazas da una media
de 15,3 onzas con una varianza de 3,5. Después de ajustar la máquina, una muestra de 10 tazas produce un promedio de 17,1 onzas con una varianza
de 3,9. Si se asume que es constante antes y después del ajuste, construya un intervalo de confianza del 95% para la diferencia entre los contenidos
promedio de llenado. Se asume que las cantidades dispensadas están distribuidas normalmente.

Construcción de intervalo de confianza


Cálculo de estimado mancomunado de
Datos: varianza poblacional
 
3,66 3,66

3,5 ( 15 − 1 ) +3,9 ( 10− 1 )
𝑠  𝑝2=
Antes ajuste Desp. Ajuste 15+10− 2
𝐼.𝐶 𝑝𝑎𝑟𝑎 ( 𝜇1 −𝜇2 ) =(15,3−17,1)±2,069 +
𝑠  𝑝2=
3,5 ( 14 ) +3,9 ( 9 )
= 𝟑 ,𝟔𝟔
15 10
23
 
3,66 3,66

 
3,66 3,66
Nivel de confianza = 95%
Significancia = 0,05
g.L = 15 + 10 – 2 = 23
( 15,3−17,1 ) +2,069

Intervalo de confianza del 95%


√+
15 10
( 15,3−17,1 ) −2,069 +
15 10
Valor en tabla t = 2,069

 − 𝟑 , 𝟒𝟏 ≤ ( 𝝁 𝟏 − 𝝁𝟐 ) ≤ − 𝟎 , 𝟏𝟗 Interpretación: Se puede tener un nivel de


confianza del 95% en el que el ajuste incrementó
el nivel de contenido promedio entre 0,19 onzas y
3,41 onzas.
Caso 2: Suponiendo que las varianzas
poblacionales son desiguales y desconocidas
Sino hay • No se puede aplicar los FÓRMULAS
evidencia para procedimientos anteriores
• De hecho, no hay Grados de libertad cuando las varianzas
asumir igualdad poblacionales no son iguales
entre las distribución exacta para
este tipo de muestreo. 𝑠1 2 𝑠22
2

varianzas de dos  
( 𝑛1
+
𝑛2 )
poblaciones: 𝑔 .𝑙 =
𝑠1 2 𝑠 22
( 𝑛1 ) +
( 𝑛2 )
( 𝑛1 − 1 ) (𝑛2− 1)

• Se propone una Intervalo para la diferencia entre medias


aproximación tal que utilice poblacionales
Para esto, se el estadístico t con g.l
realizan levemente alterados.   2 2
𝑠1 𝑠2
aproximaciones • Donde
𝐼 .𝐶 𝑝𝑎𝑟𝑎 ( 𝜇1 −𝜇2 ) =( 𝑋´ 1 − 𝑋´ 2)±𝑡′ +
𝑛1 𝑛2 √
Ejemplo 3:
The Wall Street Journal describió dos programas de entrenamiento utilizados por IBM. Doce ejecutivos a quienes se les dio el primer tipo de
entrenamiento obtuvieron un promedio de 73,5 en la prueba de competencia. Aunque el artículo de noticias no reportó la desviación estándar para
estos 12 empleados, se asume que la varianza en los puntajes para este grupo fue de 100,2. Quince ejecutivos a quienes se les administró el segundo
programa de entrenamiento obtuvieron un promedio de 79,8. Se asume una varianza de 121,3 para este segundo grupo. Haga un intervalo de
confianza del 95% para la diferencia en los puntajes promedio para ejecutivos que ingresaron a estos programas.

Construcción de intervalo de confianza


Datos: Cálculo de los grados de libertad
2
1er programa 2do programa   100,2 121,3
( + )  
100,2 121,3

12 15
𝑔 .𝑙 =
( 12 ) + ( 15 ) 𝐼.𝐶 𝑝𝑎𝑟𝑎 ( 𝜇1 −𝜇2 )=(73,5−79,8)±2,064 +
2 2
100,2 121,3

( 12 − 1 ) ( 15 − 1 )
12 15
Si es fraccionario, se
aproxima hacia el
   
100,2 121,3 100,2 121,3
√ √
siguiente valor, se toma el
entero inmediatamente
anterior,. ( 73,5−79,8 ) +2,064 + ( 73,5−79,8 ) −2,064 +
Nivel de confianza = 95% 12 15 12 15
Significancia = 0,05
g.L = 24 Intervalo de confianza del 95%
Valor en tabla t = 2,064 Interpretación: Debido a que el intervalo contiene cero, no
 − 𝟏𝟒 ,𝟔𝟔 ≤ ( 𝝁𝟏 − 𝝁 𝟐 ) ≤ − 𝟐 , 𝟎𝟔 existe fuerte evidencia de que exista diferencia alguna en la
efectividad de los programas de entrenamiento.
Paso 2. Pruebas de hipótesis Tanto para prueba Z
como para t se utiliza
el mismo criterio

Hay tres formas que puede tener la Son las siguientes: Caso 1 Se rechaza H0 si:
prueba de hipótesis.
𝐻  0 :𝜇 1 −𝜇 2 ≥ 𝐷0 𝑍
  > 𝑍 1 −∝

Caso 2 Se rechaza H0 si:


Se elige el nivel de Determinado por la
𝑍
significancia y el estimador   > 𝑍 1 − ( ∝/2 )
puntual.
diferencia de
medias. 𝐻  0 :𝜇 1 −𝜇 2=𝐷0 𝑍
  <− 𝑍 1 − ( ∝/ 2)
Caso 3 Se rechaza H0 si:

𝑍
  < 𝑍 1 −∝
Calcular el valor estadístico de
Dependerá del tipo 𝐻  0 :𝜇 1 −𝜇 2 ≤ 𝐷0
de muestra, para
la prueba. hacer uso del
estadístico Z o t. Se Estadísticos de prueba
siguen las mismas
Prueba z Prueba t
reglas
anteriormente (𝑋
´ 1−𝑋
´ 2)
 𝑍 = ( 𝑋 𝑡  =
´ 1− 𝑋
´ 2)
Encontrar el valor-p mencionadas. 2
𝑠1 𝑠2
2


2
𝜎1
𝑛1
+
𝜎2
𝑛2
2

√ 𝑛1
+
𝑛2
Tabla de fórmulas dependiendo de cada caso
Estimación de Intervalo de confianza Prueba de hipótesis

Construcción de Intervalo Casos Rechazos Estadístico de prueba


Condiciones Error estándar
ߪଵଶ ߪଶଶ ܽ ߤଵ െ
‫ܫ‬Ǥ‫݌ܽݎܽ ܥ‬ ߤଶ ‫ܪ‬଴ǣߤଵ െߤ ଶ ൒ ‫ܦ‬଴
ߪ௑തభ ି௑തమ ൌ ൅ തଵ െ തଶሻ ‫ߪܼ ט‬௑തି௑ത ܼ ൐ ܼଵି ‫ן‬
2 ݊ଵ ݊ଶ ൌ ሺܺ ܺ ‫ܪ‬ଵǣߤଵ െߤଶ ൏ ‫ܦ‬଴
a) n≥30 y σ conocida భ మ

ܺଵെ ܺത

‫ݏ‬ଵଶ ‫ݏ‬ଶଶ ‫ܪ‬଴ǣߤଵ െߤଶ ൌ ‫ܦ‬଴ ܼ൐ ܼଵି ‫ן‬Ȁଶ ܼൌ
Prueba Z b) n≥30 y σ2
‫ݏ‬௑തభି௑തమ ൌ ൅ തଵ െ
ܽ ߤଵ െ
‫ܫ‬Ǥ‫݌ܽ ܽݎ ܥ‬ ߤଶ
തଶሻ ‫ݏܼ ט‬௑ത ି௑ത ‫ܪ‬ଵǣߤଵ െߤଶ ് ‫ܦ‬଴ ܼ ൏ െܼଵି ‫ ן‬Ȁଶ ߪଵଶ ߪଶଶ
݊ଵ ݊ଶ ൌ ሺܺ ܺ ൅
desconocida భ మ
݊ଵ ݊ଶ
‫ܪ‬଴ǣߤଵ െߤଶ ൑ ‫ܦ‬଴
‫ܪ‬ଵǣߤଵ െߤଶ ൐ ‫ܦ‬଴ ܼ ൏ ܼଵି ‫ן‬

Estimado mancomunado de
a) n≤30 y asumir ܽ ߤଵ െ
‫ܫ‬Ǥ‫݌ܽݎܽ ܥ‬ ߤଶ ‫ܪ‬଴ǣߤଵ െߤଶ ൒ ‫ܦ‬଴ ‫ ݐ‬൐‫ݐ‬
ଵି ‫ן‬
‫ݏ‬ଵଶ ݊ଵ െ ͳ ൅ ‫ݏ‬ଶଶ ݊ଶ െͳ ‫ܪ‬ଵǣߤଵ െߤଶ ൏ ‫ܦ‬଴
varianzas iguales y ‫ݏ‬௣ ଶ

݊ଵ ൅ ݊ଶ െʹ ൌതଵ െ
ሺܺ തଶሻേ
ܺ ‫ݐ‬
‫ݏ‬௣ ଶ ‫ݏ‬௣ ଶ
൅ ܺതଵെ ܺത

desconocidas ݊ଵ ݊ଶ
‫ܪ‬଴ǣߤଵ െߤଶ ൌ ‫ܦ‬଴ ‫ ݐ‬൐‫ݐ‬ଵି ‫ן‬Ȁଶ ‫ݐ‬ൌ
Grados de libertad ‫ܪ‬ଵǣߤଵ െߤଶ ് ‫ܦ‬଴ ‫ ݐ‬൏ െ
‫ݐ‬ଵି ‫ן‬Ȁଶ ‫ݏ‬ଵ ଶ ‫ݏ‬ଶଶ
Prueba t ൅
‫ݏ‬ଵଶ ‫ݏ‬ଶଶ


ܽ ߤଵ െ
‫ܫ‬Ǥ‫݌ܽݎܽ ܥ‬ ߤଶ ݊ଵ ݊ଶ
a) n≤30 y varianzas ݊ଵ ݊ଶ
݃Ǥ݈ൌ ଶ ‫ݏ‬ଵଶ ‫ݏ‬ଶଶ ‫ܪ‬଴ǣߤଵ െߤଶ ൑ ‫ܦ‬଴
‫ݏ‬ଵ ‫ݏ‬ଶଶ ൌതଵ െ
ሺܺ തଶሻേԢ
ܺ ‫ݐ‬ ൅ ‫ ݐ‬൏‫ݐ‬ଵି ‫ן‬
desiguales y ݊ଵ ݊ଶ ݊ଵ ݊ଶ ‫ܪ‬ଵǣߤଵ െߤଶ ൐ ‫ܦ‬଴

desconocidas ݊ଵ െ ͳ ݊ଶ െ ͳ
Ejercicios de
aplicación
Aplicación de pruebas de hipótesis con caso z y caso t

También podría gustarte