Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1 //Escenario
Escenario26
Lectura fundamental
Fundamental
Prueba de
Etapas de un
hipótesis
plan deen
comunicación
dos
estratégica
poblaciones
Contenido
Palabras clave: hipótesis nula, error tipo I, error tipo II, nivel de significancia.
Muchas veces, en el análisis estadístico, el interés se centra en la comparación de los parámetros en
dos poblaciones para establecer si existen diferencias significativas. En este Escenario, iniciamos con
las medias de dos poblaciones que se conoce también como la prueba para diferencia de medias que
analizamos en diferentes contextos.
Una obra de construcción requiere un gran número de bloques de concreto. Dos empresas
abastecedoras A y B licitan para su adjudicación, y dentro del pliego de condiciones se estipula que
la resistencia mínima es de 1.000 unidades métricas a la resistencia, y el contrato se adjudicará a la
empresa que mayor resistencia presente su producto.
Paso 1: se plantea la hipótesis nula (Ho) que indica que no existe diferencia entre las resistencias medias
a la compresión de los bloques de concreto. La hipótesis alternativa plantea que hay alguna diferencia
significativa entre las dos resistencias medias a la compresión. Simbólicamente se expresa así:
POLITÉCNICO GRANCOLOMBIANO 2
Dado que la hipótesis alternativa no indica una dirección específica, la prueba es de dos colas.
Paso 2: se elige un nivel de significancia de 0.01. Esto equivale a cometer un error de tipo I. Así, se
usará una distribución normal estandarizada en Z, razón por la cual se debe seleccionar una muestra
que al menos contenga como mínimo 30 unidades de bloque, cada una de las empresas licitantes.
Suponga que se seleccionó una muestra de cada una de las empresas licitantes y determinó la
resistencia a la compresión, con los siguientes resultados:
Licitante A Licitante B
X̅ = 1.070 X̅ = 1.020
n = 81 n = 64
S = 63 S = 57
Z = 5,01
POLITÉCNICO GRANCOLOMBIANO 3
Paso 4: recuerde que se seleccionó un nivel de significancia del 0.10 y se utilizará una prueba de dos
colas. Los valores críticos y las zonas de aceptación para las hipótesis se presentan en la siguiente figura:
Zona de
Zona de rechazo aceptación Zona de rechazo
0,05 0,90 0,05
1,65 1,65
Paso 5: el valor Z calculado queda en el área de rechazo de la hipótesis nula, por lo tanto, se concluye
que la media poblacional de la resistencia a la compresión es diferente en las dos empresas y la
diferencia no se debe al azar del muestreo, con un nivel de significancia del 10%.
Suponiendo que las varianzas de las poblaciones son iguales, vamos a utilizar la siguiente varianza
ponderada o estimación conjunta de la varianza.
POLITÉCNICO GRANCOLOMBIANO 4
Otra diferencia, es la forma como se calcula el error estándar, para obtenerlo utilizamos
la siguiente ecuación:
Veamos el ejemplo.
Cajero A 5 8 7 6 9 7
Cajero B 8 10 7 11 9 12 14 9
• Muestras pequeñas
Gl = (6+8-2) = 12
Paso 3: ahora, para un nivel de significancia α = 5%, buscamos el valor de la tabla t con 14 gl.
POLITÉCNICO GRANCOLOMBIANO 5
Zona de
Zona de rechazo NO rechazo Zona de rechazo
0,025 0,95 0,025
-2,179 2,179
Cajero A X̅ 1 = 7 S₁ = 1,4142
CajeroB X̅ 2 = 10 S₂ = 2,2678
Sp = 1,9579
POLITÉCNICO GRANCOLOMBIANO 6
Y el error estándar
T = -2,8371
Paso 5: Tomamos la decisión con la comparación del valor calculado y los puntos críticos.
Zona de
Zona de rechazo NO rechazo Zona de rechazo
0,025 0,95 0,025
El valor calculado está en la zona de rechazo, por lo tanto, la decisión es rechazar la hipótesis Ho.
POLITÉCNICO GRANCOLOMBIANO 7
Con un nivel de significancia del 5%, se puede decir que sí existen diferencias significativas en el
tiempo de atención de los dos cajeros.
Se toma un grupo de 10 empleados de una fábrica y se mide el número de unidades producidas antes
y después de un programa de capacitación. Se quiere establecer con un nivel de significancia del 5%
si existen diferencias significativas en el número de unidades producidas. Los resultados obtenidos son
los que se presentan enseguida.
Tabla 2. Número de unidades producidas
Antes de la Después de la
Empleado
capacitación capacitación
1 128 135
2 105 110
3 119 131
4 140 142
5 98 105
6 123 130
7 127 131
8 115 110
9 122 125
10 1 45 149
POLITÉCNICO GRANCOLOMBIANO 8
Vamos a seguir los pasos para una prueba de hipótesis
1. Planteamos la hipótesis
Conceptualmente no tenemos dos muestras, sino una muestra de la diferencia de valores. Entonces
reescribimos nuestra hipótesis como la media de las diferencias es cero contra la hipótesis de que la
media de la diferencia es diferente de cero.
2. Condiciones
Para este ejemplo, tenemos que el tamaño de muestra es menor de 30 y desconocemos la desviación
estándar de la población. Entonces, tenemos que utilizar la distribución t para esta prueba de
hipótesis.
3. Encontramos el valor crítico en la tabla t con 9 grados de libertad y un nivel de significancia del 5%
POLITÉCNICO GRANCOLOMBIANO 9
El valor crítico es 2,262
Después Diferencia
Antes de la
Empleado de la
capacitación D
capacitación
1 128 135 -7
2 105 110 -5
4 140 142 -2
5 98 105 -7
6 123 130 -7
7 127 131 -4
8 115 110 5
9 122 125 -3
10 1 45 149 -4
Media -4.6
Desviación 4,402
estandar
POLITÉCNICO GRANCOLOMBIANO 10
= -4.6
Sd = 4.402
5. Se toma la decisión, en la que al comparar el valor calculado con el valor crítico se observa que
el valor calculado se encuentra en zona de rechazo, por lo tanto, con un nivel de significancia del
5%, se puede decir que sí existen diferencias significativas en el número de unidades producidas
antes y después de la capacitación.
Dos lotes de frutas conformados cada uno por 250 unidades son tratados y almacenados en
iguales condiciones salvo que, el lote No 1 está a temperatura ligeramente inferior que el lote No
2. Pasado un tiempo se encuentra que el lote No 1 hay 225 frutas sanas y en el lote No 2 hay 200
sanas. Probar la hipótesis que la temperatura más baja favorece la conservación de las frutas al nivel
de significación de 0.05.
POLITÉCNICO GRANCOLOMBIANO 11
Paso 1
Paso 2: utilizando la distribución de probabilidad normal con ensayo unilateral a la derecha, con un
nivel significativo de 0.05, el valor crítico es de 1.645.
Paso 3:
Paso 4: como 3.12 > 1.645 se rechaza la hipótesis nula y se acepta la hipótesis alternativa.
La razón entre dos varianzas, se define como la razón de dos variables Ji-cuadrada independientes,
provenientes de dos poblaciones normales, dividida cada una de ellas por sus respectivos grados de
libertad. En estas condiciones, la razón de varianzas se puede expresar como sigue:
POLITÉCNICO GRANCOLOMBIANO 12
Las hipótesis tienen la misma forma de las planteadas anteriormente así:
Veamos el ejemplo, cuyo enunciado es tomado de Montgomery y Runger (2012) relacionado con los
intervalos de confianza para la razón de varianzas.
Vamos a trabajar con hipótesis el ejercicio planteado en los intervalos de confianza para la razón
de varianzas.
Una compañía de transporte de carga desea escoger la mejor ruta para llevar la mercancía de un
depósito a otro. La mayor preocupación es el tiempo de viaje. En el estudio se seleccionaron al azar
cinco choferes de un grupo de 10 y se asignaron a la ruta A; los cinco restantes se asignaron a la ruta
B. Los datos obtenidos fueron:
Ruta A 20 26 32 21 30
Ruta B 24 29 34 25 32
Con un nivel de significancia del 10%, ¿se podrá pensar que las varianzas son iguales?
Solución
• Planteamiento de hipótesis:
1. Condiciones
POLITÉCNICO GRANCOLOMBIANO 13
2. Valor crítico en la tabla de distribución F
Los valores de la tabla para α= 0,05 y v1 = 4 grados de libertad del numerador y v2 = 4 grados de
libertad del denominador son F = 6,3882
0,05
F
6,3882
Figura 5. Distribución F
Fuente: Montgomery y Runger, (2002)
4. Decisión: el valor calculado es menor al valor crítico, por lo tanto, no existe suficiente
evidencia para rechazar la hipótesis nula. Con un nivel de significancia del 10%, se puede
pensar que las varianzas son iguales.
Muchos estudios tienen resultados expresados en datos que son categóricos o cualitativos, en vez
de cuantitativos y que admiten más de dos resultados posibles, por ejemplo, cuando se evalúa un
grupo de trabajadores de acuerdo a su desempeño (regular, bueno excelente) estos datos tienen la
característica de un experimento multinomial.
Una prueba de bondad de ajuste mide una sola variable categórica, por lo tanto, cada elemento de la
población se asigna a una y sola una de varias categorías K.
POLITÉCNICO GRANCOLOMBIANO 14
Para cada categoría, se posee un valor preconcebido o histórico de probabilidad pi y usamos
información muestral para determinar, si dichos valores son correctos. Las hipótesis propuestas en
estos casos son:
Estadística de prueba:
Regla de decisión:
Veamos el ejemplo:
Se tiene la siguiente información sobre el número de errores encontrados en 440 unidades producidas
Número
0 1 2 3 4 5 6 7 8 9
de errores
Frecuencia
18 53 103 107 82 46 18 10 2 1
observada Oi
Fuente: elaboración propia
¿Será que el número de errores tendrá una distribución de Poisson? En forma simbólica:
POLITÉCNICO GRANCOLOMBIANO 15
Se parte de que la hipótesis nula es verdadera, es decir, que la distribución de Poisson con parámetro
ƛ, que es la media de los datos.
Ahora, vamos a calcular probabilidades de errores con la distribución de Poisson con ƛ = 3,05
Recordemos que estas probabilidades se pueden obtener fácilmente con la ayuda de la función fx de Excel
POLITÉCNICO GRANCOLOMBIANO 16
Figura 7 Distribución de Poisson en Excel parámetros
Fuente: elaboración propia
Número 0 1 2 3 4 5 6 7 8 9
errores
Frecuencia
observada 18 53 103 107 82 46 18 10 2 1
Oi
P(x) 0,0474 0,1444 0,2203 0,2239 0,1708 0,1042 0,0530 0,0231 0,0088 0,0030
Frecuencia
Esperada 20,8379 63,5557 96,9224 98,5378 75,1351 45,8324 23,2981 10,1513 3,8702 1,3116
Ei
POLITÉCNICO GRANCOLOMBIANO 17
Ahora observemos que las dos últimas frecuencias esperadas son menores a 5 por lo tanto las unimos
en una sola quedando la tabla:
Número 0 1 2 3 4 5 6 7 8 y más
errores
Frecuencia
observada 18 53 103 107 82 46 18 10 2
Oi
P(x) 0,0474 0,1444 0,2203 0,2239 0,1708 0,1042 0,0530 0,0231 0,0088
Frecuencia
Esperada 20,8379 63,5557 96,9224 98,5378 75,1351 45,8324 23,2981 10,1513 5,1818
Ei
Ahora, encontramos el valor crítico en la distribución chi.cuadrado con (k-p-1) grados de libertad. Es decir:
K número de categorías = 9
POLITÉCNICO GRANCOLOMBIANO 18
Tabla 7. Distribución Ji cuadrado
Con un nivel de significancia del 5%, se puede decir que los datos tienen distribución de Poisson.
Llegamos al final de la Lectura fundamental del Escenario 6 en el cual trabajamos hipótesis para dos
muestras y una hipótesis de bondad de ajuste. En el siguiente Escenario vamos a trabajar hipótesis para tres
y más grupos.
POLITÉCNICO GRANCOLOMBIANO 19
Referencias
Gutiérrez, H. & De la Vara, R. (2005). Control estadístico de Calidad y Seis Sigma. México D. F.:
McGrawHill.
POLITÉCNICO GRANCOLOMBIANO 20
INFORMACIÓN TÉCNICA
POLITÉCNICO GRANCOLOMBIANO 21