Lectura 6 PDF

Unidad 3
1 //Escenario
Escenario26
Lectura fundamental
Fundamental
Prueba de
Etapas de un
hipótesis
plan deen
comunicación
dos
estratégica
poblaciones
Contenido
1 Prueba para la diferencia de dos promedios poblacionales
2 Prueba para la diferencia de medias. Muestras pequeñas
3 Prueba de hipótesis para muestras pareadas
4 Prueba de hipótesis para diferencia de proporciones
5 Prueba de hipótesis para el cociente de varianzas
6 Prueba de bondad de ajuste
Palabras clave: hipótesis nula, error tipo I, error tipo II, nivel de significancia.
Muchas veces, en el análisis estadístico, el interés se centra en la comparación de los parámetros en
dos poblaciones para establecer si existen diferencias significativas. En este Escenario, iniciamos con
las medias de dos poblaciones que se conoce también como la prueba para diferencia de medias que
analizamos en diferentes contextos.
1. Prueba para la diferencia de dos promedios poblacionales

Para la diferencia o comparación de dos promedios poblacionales, en el primer caso, vamos a
suponer que las muestras se obtienen de manera aleatoria e independiente a partir de las poblaciones
respectivas, que tiene una distribución normal con varianzas poblacionales iguales, es decir,
, entonces, se puede utilizar una prueba de distribución normal de varianzas combinadas
para determinar si existe una diferencia significativa entre las dos poblaciones.
Recordemos que para diferencias de medias se utiliza el siguiente estadístico de prueba:
Veamos el siguiente ejemplo (Gutiérrez y De la Vara, 2005):
Una obra de construcción requiere un gran número de bloques de concreto. Dos empresas
abastecedoras A y B licitan para su adjudicación, y dentro del pliego de condiciones se estipula que
la resistencia mínima es de 1.000 unidades métricas a la resistencia, y el contrato se adjudicará a la
empresa que mayor resistencia presente su producto.
Paso 1: se plantea la hipótesis nula (Ho) que indica que no existe diferencia entre las resistencias medias
a la compresión de los bloques de concreto. La hipótesis alternativa plantea que hay alguna diferencia
significativa entre las dos resistencias medias a la compresión. Simbólicamente se expresa así:
POLITÉCNICO GRANCOLOMBIANO 2
Dado que la hipótesis alternativa no indica una dirección específica, la prueba es de dos colas.
Paso 2: se elige un nivel de significancia de 0.01. Esto equivale a cometer un error de tipo I. Así, se
usará una distribución normal estandarizada en Z, razón por la cual se debe seleccionar una muestra
que al menos contenga como mínimo 30 unidades de bloque, cada una de las empresas licitantes.
Paso 3: El estadístico de prueba a aplicar está dado por la siguiente fórmula:
Suponga que se seleccionó una muestra de cada una de las empresas licitantes y determinó la
resistencia a la compresión, con los siguientes resultados:
Tabla 1. Ejemplo resistencia a la compresión
Licitante A Licitante B
X̅ = 1.070 X̅ = 1.020
n = 81 n = 64
S = 63 S = 57
Fuente: elaboración propia
El valor del estadístico de prueba es:
Z = 5,01
Paso 4: recuerde que se seleccionó un nivel de significancia del 0.10 y se utilizará una prueba de dos
colas. Los valores críticos y las zonas de aceptación para las hipótesis se presentan en la siguiente figura:
Zona de
Zona de rechazo aceptación Zona de rechazo
0,05 0,90 0,05
1,65 1,65
Figura 1. Distribución normal nivel 10%

Paso 5: el valor Z calculado queda en el área de rechazo de la hipótesis nula, por lo tanto, se concluye
que la media poblacional de la resistencia a la compresión es diferente en las dos empresas y la
diferencia no se debe al azar del muestreo, con un nivel de significancia del 10%.
2. Prueba para la diferencia de medias. Muestras pequeñas

Cuando se quiere probar la diferencia de medias con muestras pequeñas, el procedimiento sufre algunos
cambios, ya que en los casos en donde los tamaños de muestra eran mayores de 30 se estimaban las
desviaciones estándar de la población con las desviaciones de la muestra, pero para muestras pequeñas
este procedimiento no es adecuado, ya que aquí se necesita estimar la varianza común.
Suponiendo que las varianzas de las poblaciones son iguales, vamos a utilizar la siguiente varianza
ponderada o estimación conjunta de la varianza.
Como se tienen muestras pequeñas y no se conocen las varianzas de la población, se utiliza la

distribución t con grados de libertad (n1 + n2 - 2) que corresponden a las dos muestras.
Otra diferencia, es la forma como se calcula el error estándar, para obtenerlo utilizamos
la siguiente ecuación:
Veamos el ejemplo.
El gerente de una entidad financiera quiere determinar si existen diferencias significativas en el

tiempo de atención de dos cajeros. Una muestra aleatoria de seis clientes atendidos por el cajero A, y
de ocho clientes atendidos por el cajero B arrojan los siguientes resultados (tiempo en minutos).
Cajero A 5 8 7 6 9 7
Cajero B 8 10 7 11 9 12 14 9
Paso 1: planteamiento de las hipótesis
Paso 2: analizamos las condiciones
• Muestras pequeñas
• Desviaciones estándar de la población desconocidas
Entonces, trabajamos con la distribución t
Observamos que n1 = 6 y n2 = 8, entonces, los grados de libertad son:
Gl = (6+8-2) = 12
Paso 3: ahora, para un nivel de significancia α = 5%, buscamos el valor de la tabla t con 14 gl.
Zona de
Zona de rechazo NO rechazo Zona de rechazo
0,025 0,95 0,025
-2,179 2,179
Figura 2. Valores críticos distribución t

Los valores críticos son - 2,179 y 2,179
Paso 4: calculamos la estadística de prueba:
Calculamos la media y la desviación estándar para cada muestra, obteniendo:
Cajero A X̅ 1 = 7 S₁ = 1,4142
CajeroB X̅ 2 = 10 S₂ = 2,2678
Primero, calculamos la desviación estándar conjunta, en donde:
Sp = 1,9579
Y el error estándar
Ahora, reemplazamos en la estadística de prueba:
T = -2,8371
Paso 5: Tomamos la decisión con la comparación del valor calculado y los puntos críticos.
Zona de
Zona de rechazo NO rechazo Zona de rechazo
0,025 0,95 0,025
-2,8371 -2,179 2,179
Figura 3. Valor calculado y puntos críticos

El valor calculado está en la zona de rechazo, por lo tanto, la decisión es rechazar la hipótesis Ho.
Con un nivel de significancia del 5%, se puede decir que sí existen diferencias significativas en el
tiempo de atención de los dos cajeros.
3. Prueba de hipótesis para muestras pareadas

En el caso de la sección anterior, estamos trabajando con muestras independientes, pero con
frecuencia, vamos a necesitar tomar muestras que no son independientes entre sí; revisemos este
tipo de prueba de hipótesis con el siguiente ejemplo.
Se toma un grupo de 10 empleados de una fábrica y se mide el número de unidades producidas antes
y después de un programa de capacitación. Se quiere establecer con un nivel de significancia del 5%
si existen diferencias significativas en el número de unidades producidas. Los resultados obtenidos son
los que se presentan enseguida.
Tabla 2. Número de unidades producidas
Antes de la Después de la
Empleado
capacitación capacitación
1 128 135
2 105 110
3 119 131
4 140 142
5 98 105
6 123 130
7 127 131
8 115 110
9 122 125
10 1 45 149
Vamos a seguir los pasos para una prueba de hipótesis
1. Planteamos la hipótesis
Conceptualmente no tenemos dos muestras, sino una muestra de la diferencia de valores. Entonces
reescribimos nuestra hipótesis como la media de las diferencias es cero contra la hipótesis de que la
media de la diferencia es diferente de cero.
Aquí tenemos una prueba de dos colas
2. Condiciones
Para este ejemplo, tenemos que el tamaño de muestra es menor de 30 y desconocemos la desviación
estándar de la población. Entonces, tenemos que utilizar la distribución t para esta prueba de
hipótesis.
3. Encontramos el valor crítico en la tabla t con 9 grados de libertad y un nivel de significancia del 5%
Figura 4. Distribución t student

Fuente: Montgomery y Runger, (2002)
El valor crítico es 2,262
4. Encontramos la estadística de prueba
Tabla 3. Unidades producidas antes y después
Después Diferencia
Antes de la
Empleado de la
capacitación D
capacitación
1 128 135 -7
2 105 110 -5
3 119 131 -12
4 140 142 -2
5 98 105 -7
6 123 130 -7
7 127 131 -4
8 115 110 5
9 122 125 -3
10 1 45 149 -4
Media -4.6
Desviación 4,402
estandar
= -4.6
Sd = 4.402
Con el error estándar de la media, reemplazamos en la estadística de prueba:
5. Se toma la decisión, en la que al comparar el valor calculado con el valor crítico se observa que
el valor calculado se encuentra en zona de rechazo, por lo tanto, con un nivel de significancia del
5%, se puede decir que sí existen diferencias significativas en el número de unidades producidas
antes y después de la capacitación.
4. Prueba de hipótesis para diferencias entre dos proporciones

Se presenta a continuación un ejemplo en el que se emplea la prueba de proporción para la diferencia
entre dos poblaciones (Gutiérrez y De la Vara, 2005), utilizando el siguiente estadístico de prueba:
Dos lotes de frutas conformados cada uno por 250 unidades son tratados y almacenados en
iguales condiciones salvo que, el lote No 1 está a temperatura ligeramente inferior que el lote No
2. Pasado un tiempo se encuentra que el lote No 1 hay 225 frutas sanas y en el lote No 2 hay 200
sanas. Probar la hipótesis que la temperatura más baja favorece la conservación de las frutas al nivel
de significación de 0.05.
Paso 1
Paso 2: utilizando la distribución de probabilidad normal con ensayo unilateral a la derecha, con un
nivel significativo de 0.05, el valor crítico es de 1.645.
Paso 3:
Paso 4: como 3.12 > 1.645 se rechaza la hipótesis nula y se acepta la hipótesis alternativa.
Paso 5: La temperatura más baja favorece la conservación de las frutas.
5. Prueba de hipótesis para el cociente de varianzas

En los procesos industriales, además de tener controlado el valor medio es de suma importancia
mantener dicho proceso con una varianza baja de manera que el resultado del mismo sea el más
homogéneo posible. Cuando se tienen dos poblaciones la comparación de las varianzas se establece
con la razón o cociente entre ellas
La razón entre dos varianzas, se define como la razón de dos variables Ji-cuadrada independientes,
provenientes de dos poblaciones normales, dividida cada una de ellas por sus respectivos grados de
libertad. En estas condiciones, la razón de varianzas se puede expresar como sigue:
Recordemos que en la Unidad 2, en el Escenario 4, hicimos la estimación por intervalo para el

cociente de varianzas y trabajamos la distribución F con grados de libertad v1= (n1-1) en el numerador
y v2= (n2-1) en el denominador.
Las hipótesis tienen la misma forma de las planteadas anteriormente así:
La hipótesis bilateral a dos colas
Y así, para las hipótesis bilaterales.
Veamos el ejemplo, cuyo enunciado es tomado de Montgomery y Runger (2012) relacionado con los
intervalos de confianza para la razón de varianzas.
Vamos a trabajar con hipótesis el ejercicio planteado en los intervalos de confianza para la razón
de varianzas.
Una compañía de transporte de carga desea escoger la mejor ruta para llevar la mercancía de un
depósito a otro. La mayor preocupación es el tiempo de viaje. En el estudio se seleccionaron al azar
cinco choferes de un grupo de 10 y se asignaron a la ruta A; los cinco restantes se asignaron a la ruta
B. Los datos obtenidos fueron:
Ruta A 20 26 32 21 30
Ruta B 24 29 34 25 32
Con un nivel de significancia del 10%, ¿se podrá pensar que las varianzas son iguales?
Solución
• Planteamiento de hipótesis:
1. Condiciones
n1 = 5 X̅ 1 = 25,8 S₁ = 5,31 S₁2 = 28,2
n1 = 5 X̅ 2 = 28,8 S2 = 4,32 S₂2 = 18,7
2. Valor crítico en la tabla de distribución F
Los valores de la tabla para α= 0,05 y v1 = 4 grados de libertad del numerador y v2 = 4 grados de
libertad del denominador son F = 6,3882
0,05
F
6,3882
Figura 5. Distribución F
3. Valor de la estadística de prueba
4. Decisión: el valor calculado es menor al valor crítico, por lo tanto, no existe suficiente
evidencia para rechazar la hipótesis nula. Con un nivel de significancia del 10%, se puede
pensar que las varianzas son iguales.
5. Prueba de bondad de ajuste
Muchos estudios tienen resultados expresados en datos que son categóricos o cualitativos, en vez
de cuantitativos y que admiten más de dos resultados posibles, por ejemplo, cuando se evalúa un
grupo de trabajadores de acuerdo a su desempeño (regular, bueno excelente) estos datos tienen la
característica de un experimento multinomial.
Una prueba de bondad de ajuste mide una sola variable categórica, por lo tanto, cada elemento de la
población se asigna a una y sola una de varias categorías K.
Para cada categoría, se posee un valor preconcebido o histórico de probabilidad pi y usamos
información muestral para determinar, si dichos valores son correctos. Las hipótesis propuestas en
estos casos son:
Ho: La muestra proviene de una población con distribución XX
H1: La muestra no proviene de la distribución XX
Estadística de prueba:
Con distribución chi-cuadrado con k-p-1 grados de libertad.
En donde K es el número de intervalos y p es el número de parámetros.
Regla de decisión:
La hipótesis nula se acepta si
La hipótesis nula no se acepta si
Veamos el ejemplo:
Se tiene la siguiente información sobre el número de errores encontrados en 440 unidades producidas
Tabla 4. Ejemplo errores en unidades producidas
Número
0 1 2 3 4 5 6 7 8 9
de errores
Frecuencia
18 53 103 107 82 46 18 10 2 1
observada Oi
¿Será que el número de errores tendrá una distribución de Poisson? En forma simbólica:
Ho: el número de errores tiene distribución de Poisson
H1: el número de errores no tiene distribución de Poisson
Se parte de que la hipótesis nula es verdadera, es decir, que la distribución de Poisson con parámetro
ƛ, que es la media de los datos.
Recordemos la media para datos agrupados
Ahora, vamos a calcular probabilidades de errores con la distribución de Poisson con ƛ = 3,05
En la función de probabilidad tenemos
Recordemos que estas probabilidades se pueden obtener fácilmente con la ayuda de la función fx de Excel
Figura 6. Distribución Poisson en Excel

Figura 7 Distribución de Poisson en Excel parámetros
En la misma forma completamos las probabilidades
Tabla 5. Ejemplo errores en unidades y probabilidad
Número 0 1 2 3 4 5 6 7 8 9
errores
Frecuencia
observada 18 53 103 107 82 46 18 10 2 1
Oi
P(x) 0,0474 0,1444 0,2203 0,2239 0,1708 0,1042 0,0530 0,0231 0,0088 0,0030
Frecuencia
Esperada 20,8379 63,5557 96,9224 98,5378 75,1351 45,8324 23,2981 10,1513 3,8702 1,3116
Ei
La frecuencia esperada para 0 errores es 440*0,0474 = 20,8379
Y así para el resto de valores.
Ahora observemos que las dos últimas frecuencias esperadas son menores a 5 por lo tanto las unimos
en una sola quedando la tabla:
Tabla 6. Ejemplo errores en unidades y probabilidad ajustada
Número 0 1 2 3 4 5 6 7 8 y más
errores
Frecuencia
observada 18 53 103 107 82 46 18 10 2
Oi
P(x) 0,0474 0,1444 0,2203 0,2239 0,1708 0,1042 0,0530 0,0231 0,0088
Frecuencia
Esperada 20,8379 63,5557 96,9224 98,5378 75,1351 45,8324 23,2981 10,1513 5,1818
Ei
Si aplicamos la estadística de prueba tenemos:
Ahora, encontramos el valor crítico en la distribución chi.cuadrado con (k-p-1) grados de libertad. Es decir:
K número de categorías = 9
P número de parámetros = 1 (la distribución de Poisson solo tiene un parámetro ƛ)
Chi.cuadrado con 7 grados de libertad y nivel de significancia 5%
Tabla 7. Distribución Ji cuadrado
Como , es decir, 6,001 < 14,067, se acepta la hipótesis nula Ho
Con un nivel de significancia del 5%, se puede decir que los datos tienen distribución de Poisson.
Llegamos al final de la Lectura fundamental del Escenario 6 en el cual trabajamos hipótesis para dos
muestras y una hipótesis de bondad de ajuste. En el siguiente Escenario vamos a trabajar hipótesis para tres
y más grupos.
Referencias
Gutiérrez, H. & De la Vara, R. (2005). Control estadístico de Calidad y Seis Sigma. México D. F.:
McGrawHill.
Montgomery, D. & Runger, G. (2002). Probabilidad y Estadística aplicadas a la Ingeniería (2 ed.).

Limusa Wiley.
INFORMACIÓN TÉCNICA
Módulo: Estadística Inferencial

Unidad 3: Hipótesis para una y dos muestras
Escenario 6: Prueba de hipótesis en dos muestras
Autor: Patricia Castillo Garzón
Asesor Pedagógico: Miguel Guevara

Diseñador Gráfico: Julieth Rodríguez
Asistente: Ginna Quiroga
Este material pertenece al Politécnico Grancolombiano.

Prohibida su reproducción total o parcial.

Lectura 6 PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Lectura 6 PDF

Cargado por

Copyright:

Formatos disponibles

Unidad 3

1 Prueba para la diferencia de dos promedios poblacionales

2 Prueba para la diferencia de medias. Muestras pequeñas

3 Prueba de hipótesis para muestras pareadas

4 Prueba de hipótesis para diferencia de proporciones

5 Prueba de hipótesis para el cociente de varianzas

6 Prueba de bondad de ajuste

1. Prueba para la diferencia de dos promedios poblacionales

Recordemos que para diferencias de medias se utiliza el siguiente estadístico de prueba:

Veamos el siguiente ejemplo (Gutiérrez y De la Vara, 2005):

Paso 3: El estadístico de prueba a aplicar está dado por la siguiente fórmula:

Tabla 1. Ejemplo resistencia a la compresión

Fuente: elaboración propia

El valor del estadístico de prueba es:

Figura 1. Distribución normal nivel 10%

2. Prueba para la diferencia de medias. Muestras pequeñas

Como se tienen muestras pequeñas y no se conocen las varianzas de la población, se utiliza la

El gerente de una entidad financiera quiere determinar si existen diferencias significativas en el

Paso 1: planteamiento de las hipótesis

Paso 2: analizamos las condiciones

• Desviaciones estándar de la población desconocidas

Entonces, trabajamos con la distribución t

Observamos que n1 = 6 y n2 = 8, entonces, los grados de libertad son:

Figura 2. Valores críticos distribución t

Los valores críticos son - 2,179 y 2,179

Paso 4: calculamos la estadística de prueba:

Calculamos la media y la desviación estándar para cada muestra, obteniendo:

Primero, calculamos la desviación estándar conjunta, en donde:

Ahora, reemplazamos en la estadística de prueba:

-2,8371 -2,179 2,179

Figura 3. Valor calculado y puntos críticos

3. Prueba de hipótesis para muestras pareadas

Fuente: elaboración propia

Aquí tenemos una prueba de dos colas

Figura 4. Distribución t student

4. Encontramos la estadística de prueba

Tabla 3. Unidades producidas antes y después

3 119 131 -12

Fuente: elaboración propia

Con el error estándar de la media, reemplazamos en la estadística de prueba:

4. Prueba de hipótesis para diferencias entre dos proporciones

Paso 5: La temperatura más baja favorece la conservación de las frutas.

5. Prueba de hipótesis para el cociente de varianzas

Recordemos que en la Unidad 2, en el Escenario 4, hicimos la estimación por intervalo para el

La hipótesis bilateral a dos colas

Y así, para las hipótesis bilaterales.

n1 = 5 X̅ 1 = 25,8 S₁ = 5,31 S₁2 = 28,2

n1 = 5 X̅ 2 = 28,8 S2 = 4,32 S₂2 = 18,7

3. Valor de la estadística de prueba

5. Prueba de bondad de ajuste

Ho: La muestra proviene de una población con distribución XX

H1: La muestra no proviene de la distribución XX

Con distribución chi-cuadrado con k-p-1 grados de libertad.

En donde K es el número de intervalos y p es el número de parámetros.

La hipótesis nula se acepta si

La hipótesis nula no se acepta si

Tabla 4. Ejemplo errores en unidades producidas

Ho: el número de errores tiene distribución de Poisson

H1: el número de errores no tiene distribución de Poisson

Recordemos la media para datos agrupados

En la función de probabilidad tenemos

Figura 6. Distribución Poisson en Excel

En la misma forma completamos las probabilidades