Está en la página 1de 21

Unidad 3

1 //Escenario
Escenario26
Lectura fundamental
Fundamental

Prueba de
Etapas de un
hipótesis
plan deen
comunicación
dos
estratégica
poblaciones

Contenido

1 Prueba para la diferencia de dos promedios poblacionales

2 Prueba para la diferencia de medias. Muestras pequeñas

3 Prueba de hipótesis para muestras pareadas

4 Prueba de hipótesis para diferencia de proporciones

5 Prueba de hipótesis para el cociente de varianzas

6 Prueba de bondad de ajuste

Palabras clave: hipótesis nula, error tipo I, error tipo II, nivel de significancia.
Muchas veces, en el análisis estadístico, el interés se centra en la comparación de los parámetros en
dos poblaciones para establecer si existen diferencias significativas. En este Escenario, iniciamos con
las medias de dos poblaciones que se conoce también como la prueba para diferencia de medias que
analizamos en diferentes contextos.

1. Prueba para la diferencia de dos promedios poblacionales


Para la diferencia o comparación de dos promedios poblacionales, en el primer caso, vamos a
suponer que las muestras se obtienen de manera aleatoria e independiente a partir de las poblaciones
respectivas, que tiene una distribución normal con varianzas poblacionales iguales, es decir,
, entonces, se puede utilizar una prueba de distribución normal de varianzas combinadas
para determinar si existe una diferencia significativa entre las dos poblaciones.

Recordemos que para diferencias de medias se utiliza el siguiente estadístico de prueba:

Veamos el siguiente ejemplo (Gutiérrez y De la Vara, 2005):

Una obra de construcción requiere un gran número de bloques de concreto. Dos empresas
abastecedoras A y B licitan para su adjudicación, y dentro del pliego de condiciones se estipula que
la resistencia mínima es de 1.000 unidades métricas a la resistencia, y el contrato se adjudicará a la
empresa que mayor resistencia presente su producto.

Paso 1: se plantea la hipótesis nula (Ho) que indica que no existe diferencia entre las resistencias medias
a la compresión de los bloques de concreto. La hipótesis alternativa plantea que hay alguna diferencia
significativa entre las dos resistencias medias a la compresión. Simbólicamente se expresa así:

POLITÉCNICO GRANCOLOMBIANO 2
Dado que la hipótesis alternativa no indica una dirección específica, la prueba es de dos colas.

Paso 2: se elige un nivel de significancia de 0.01. Esto equivale a cometer un error de tipo I. Así, se
usará una distribución normal estandarizada en Z, razón por la cual se debe seleccionar una muestra
que al menos contenga como mínimo 30 unidades de bloque, cada una de las empresas licitantes.

Paso 3: El estadístico de prueba a aplicar está dado por la siguiente fórmula:

Suponga que se seleccionó una muestra de cada una de las empresas licitantes y determinó la
resistencia a la compresión, con los siguientes resultados:

Tabla 1. Ejemplo resistencia a la compresión

Licitante A Licitante B

X̅ = 1.070 X̅ = 1.020

n = 81 n = 64

S = 63 S = 57

Fuente: elaboración propia

El valor del estadístico de prueba es:

Z = 5,01

POLITÉCNICO GRANCOLOMBIANO 3
Paso 4: recuerde que se seleccionó un nivel de significancia del 0.10 y se utilizará una prueba de dos
colas. Los valores críticos y las zonas de aceptación para las hipótesis se presentan en la siguiente figura:

Zona de
Zona de rechazo aceptación Zona de rechazo
0,05 0,90 0,05

1,65 1,65

Figura 1. Distribución normal nivel 10%


Fuente: elaboración propia

Paso 5: el valor Z calculado queda en el área de rechazo de la hipótesis nula, por lo tanto, se concluye
que la media poblacional de la resistencia a la compresión es diferente en las dos empresas y la
diferencia no se debe al azar del muestreo, con un nivel de significancia del 10%.

2. Prueba para la diferencia de medias. Muestras pequeñas


Cuando se quiere probar la diferencia de medias con muestras pequeñas, el procedimiento sufre algunos
cambios, ya que en los casos en donde los tamaños de muestra eran mayores de 30 se estimaban las
desviaciones estándar de la población con las desviaciones de la muestra, pero para muestras pequeñas
este procedimiento no es adecuado, ya que aquí se necesita estimar la varianza común.

Suponiendo que las varianzas de las poblaciones son iguales, vamos a utilizar la siguiente varianza
ponderada o estimación conjunta de la varianza.

Como se tienen muestras pequeñas y no se conocen las varianzas de la población, se utiliza la


distribución t con grados de libertad (n1 + n2 - 2) que corresponden a las dos muestras.

POLITÉCNICO GRANCOLOMBIANO 4
Otra diferencia, es la forma como se calcula el error estándar, para obtenerlo utilizamos
la siguiente ecuación:

Veamos el ejemplo.

El gerente de una entidad financiera quiere determinar si existen diferencias significativas en el


tiempo de atención de dos cajeros. Una muestra aleatoria de seis clientes atendidos por el cajero A, y
de ocho clientes atendidos por el cajero B arrojan los siguientes resultados (tiempo en minutos).

Cajero A 5 8 7 6 9 7

Cajero B 8 10 7 11 9 12 14 9

Paso 1: planteamiento de las hipótesis

Paso 2: analizamos las condiciones

• Muestras pequeñas

• Desviaciones estándar de la población desconocidas

Entonces, trabajamos con la distribución t

Observamos que n1 = 6 y n2 = 8, entonces, los grados de libertad son:

Gl = (6+8-2) = 12

Paso 3: ahora, para un nivel de significancia α = 5%, buscamos el valor de la tabla t con 14 gl.

POLITÉCNICO GRANCOLOMBIANO 5
Zona de
Zona de rechazo NO rechazo Zona de rechazo
0,025 0,95 0,025

-2,179 2,179

Figura 2. Valores críticos distribución t


Fuente: elaboración propia

Los valores críticos son - 2,179 y 2,179

Paso 4: calculamos la estadística de prueba:

Calculamos la media y la desviación estándar para cada muestra, obteniendo:

Cajero A X̅ 1 = 7 S₁ = 1,4142

CajeroB X̅ 2 = 10 S₂ = 2,2678

Primero, calculamos la desviación estándar conjunta, en donde:

Sp = 1,9579

POLITÉCNICO GRANCOLOMBIANO 6
Y el error estándar

Ahora, reemplazamos en la estadística de prueba:

T = -2,8371

Paso 5: Tomamos la decisión con la comparación del valor calculado y los puntos críticos.

Zona de
Zona de rechazo NO rechazo Zona de rechazo
0,025 0,95 0,025

-2,8371 -2,179 2,179

Figura 3. Valor calculado y puntos críticos


Fuente: elaboración propia

El valor calculado está en la zona de rechazo, por lo tanto, la decisión es rechazar la hipótesis Ho.

POLITÉCNICO GRANCOLOMBIANO 7
Con un nivel de significancia del 5%, se puede decir que sí existen diferencias significativas en el
tiempo de atención de los dos cajeros.

3. Prueba de hipótesis para muestras pareadas


En el caso de la sección anterior, estamos trabajando con muestras independientes, pero con
frecuencia, vamos a necesitar tomar muestras que no son independientes entre sí; revisemos este
tipo de prueba de hipótesis con el siguiente ejemplo.

Se toma un grupo de 10 empleados de una fábrica y se mide el número de unidades producidas antes
y después de un programa de capacitación. Se quiere establecer con un nivel de significancia del 5%
si existen diferencias significativas en el número de unidades producidas. Los resultados obtenidos son
los que se presentan enseguida.
Tabla 2. Número de unidades producidas

Antes de la Después de la
Empleado
capacitación capacitación

1 128 135

2 105 110

3 119 131

4 140 142

5 98 105

6 123 130

7 127 131

8 115 110

9 122 125

10 1 45 149

Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 8
Vamos a seguir los pasos para una prueba de hipótesis

1. Planteamos la hipótesis

Conceptualmente no tenemos dos muestras, sino una muestra de la diferencia de valores. Entonces
reescribimos nuestra hipótesis como la media de las diferencias es cero contra la hipótesis de que la
media de la diferencia es diferente de cero.

Aquí tenemos una prueba de dos colas

2. Condiciones

Para este ejemplo, tenemos que el tamaño de muestra es menor de 30 y desconocemos la desviación
estándar de la población. Entonces, tenemos que utilizar la distribución t para esta prueba de
hipótesis.

3. Encontramos el valor crítico en la tabla t con 9 grados de libertad y un nivel de significancia del 5%

Figura 4. Distribución t student


Fuente: Montgomery y Runger, (2002)

POLITÉCNICO GRANCOLOMBIANO 9
El valor crítico es 2,262

4. Encontramos la estadística de prueba

Tabla 3. Unidades producidas antes y después

Después Diferencia
Antes de la
Empleado de la
capacitación D
capacitación

1 128 135 -7

2 105 110 -5

3 119 131 -12

4 140 142 -2

5 98 105 -7

6 123 130 -7

7 127 131 -4

8 115 110 5

9 122 125 -3

10 1 45 149 -4

Media -4.6
Desviación 4,402
estandar

Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 10
= -4.6

Sd = 4.402

Con el error estándar de la media, reemplazamos en la estadística de prueba:

5. Se toma la decisión, en la que al comparar el valor calculado con el valor crítico se observa que
el valor calculado se encuentra en zona de rechazo, por lo tanto, con un nivel de significancia del
5%, se puede decir que sí existen diferencias significativas en el número de unidades producidas
antes y después de la capacitación.

4. Prueba de hipótesis para diferencias entre dos proporciones


Se presenta a continuación un ejemplo en el que se emplea la prueba de proporción para la diferencia
entre dos poblaciones (Gutiérrez y De la Vara, 2005), utilizando el siguiente estadístico de prueba:

Dos lotes de frutas conformados cada uno por 250 unidades son tratados y almacenados en
iguales condiciones salvo que, el lote No 1 está a temperatura ligeramente inferior que el lote No
2. Pasado un tiempo se encuentra que el lote No 1 hay 225 frutas sanas y en el lote No 2 hay 200
sanas. Probar la hipótesis que la temperatura más baja favorece la conservación de las frutas al nivel
de significación de 0.05.

POLITÉCNICO GRANCOLOMBIANO 11
Paso 1

Paso 2: utilizando la distribución de probabilidad normal con ensayo unilateral a la derecha, con un
nivel significativo de 0.05, el valor crítico es de 1.645.

Paso 3:

Paso 4: como 3.12 > 1.645 se rechaza la hipótesis nula y se acepta la hipótesis alternativa.

Paso 5: La temperatura más baja favorece la conservación de las frutas.

5. Prueba de hipótesis para el cociente de varianzas


En los procesos industriales, además de tener controlado el valor medio es de suma importancia
mantener dicho proceso con una varianza baja de manera que el resultado del mismo sea el más
homogéneo posible. Cuando se tienen dos poblaciones la comparación de las varianzas se establece
con la razón o cociente entre ellas

La razón entre dos varianzas, se define como la razón de dos variables Ji-cuadrada independientes,
provenientes de dos poblaciones normales, dividida cada una de ellas por sus respectivos grados de
libertad. En estas condiciones, la razón de varianzas se puede expresar como sigue:

Recordemos que en la Unidad 2, en el Escenario 4, hicimos la estimación por intervalo para el


cociente de varianzas y trabajamos la distribución F con grados de libertad v1= (n1-1) en el numerador
y v2= (n2-1) en el denominador.

POLITÉCNICO GRANCOLOMBIANO 12
Las hipótesis tienen la misma forma de las planteadas anteriormente así:

La hipótesis bilateral a dos colas

Y así, para las hipótesis bilaterales.

Veamos el ejemplo, cuyo enunciado es tomado de Montgomery y Runger (2012) relacionado con los
intervalos de confianza para la razón de varianzas.

Vamos a trabajar con hipótesis el ejercicio planteado en los intervalos de confianza para la razón
de varianzas.

Una compañía de transporte de carga desea escoger la mejor ruta para llevar la mercancía de un
depósito a otro. La mayor preocupación es el tiempo de viaje. En el estudio se seleccionaron al azar
cinco choferes de un grupo de 10 y se asignaron a la ruta A; los cinco restantes se asignaron a la ruta
B. Los datos obtenidos fueron:

Ruta A 20 26 32 21 30

Ruta B 24 29 34 25 32

Con un nivel de significancia del 10%, ¿se podrá pensar que las varianzas son iguales?

Solución

• Planteamiento de hipótesis:

1. Condiciones

n1 = 5 X̅ 1 = 25,8 S₁ = 5,31 S₁2 = 28,2

n1 = 5 X̅ 2 = 28,8 S2 = 4,32 S₂2 = 18,7

POLITÉCNICO GRANCOLOMBIANO 13
2. Valor crítico en la tabla de distribución F

Los valores de la tabla para α= 0,05 y v1 = 4 grados de libertad del numerador y v2 = 4 grados de
libertad del denominador son F = 6,3882

0,05

F
6,3882

Figura 5. Distribución F
Fuente: Montgomery y Runger, (2002)

3. Valor de la estadística de prueba

4. Decisión: el valor calculado es menor al valor crítico, por lo tanto, no existe suficiente
evidencia para rechazar la hipótesis nula. Con un nivel de significancia del 10%, se puede
pensar que las varianzas son iguales.

5. Prueba de bondad de ajuste

Muchos estudios tienen resultados expresados en datos que son categóricos o cualitativos, en vez
de cuantitativos y que admiten más de dos resultados posibles, por ejemplo, cuando se evalúa un
grupo de trabajadores de acuerdo a su desempeño (regular, bueno excelente) estos datos tienen la
característica de un experimento multinomial.

Una prueba de bondad de ajuste mide una sola variable categórica, por lo tanto, cada elemento de la
población se asigna a una y sola una de varias categorías K.

POLITÉCNICO GRANCOLOMBIANO 14
Para cada categoría, se posee un valor preconcebido o histórico de probabilidad pi y usamos
información muestral para determinar, si dichos valores son correctos. Las hipótesis propuestas en
estos casos son:

Ho: La muestra proviene de una población con distribución XX

H1: La muestra no proviene de la distribución XX

Estadística de prueba:

Con distribución chi-cuadrado con k-p-1 grados de libertad.

En donde K es el número de intervalos y p es el número de parámetros.

Regla de decisión:

La hipótesis nula se acepta si

La hipótesis nula no se acepta si

Veamos el ejemplo:

Se tiene la siguiente información sobre el número de errores encontrados en 440 unidades producidas

Tabla 4. Ejemplo errores en unidades producidas

Número
0 1 2 3 4 5 6 7 8 9
de errores
Frecuencia
18 53 103 107 82 46 18 10 2 1
observada Oi
Fuente: elaboración propia

¿Será que el número de errores tendrá una distribución de Poisson? En forma simbólica:

Ho: el número de errores tiene distribución de Poisson

H1: el número de errores no tiene distribución de Poisson

POLITÉCNICO GRANCOLOMBIANO 15
Se parte de que la hipótesis nula es verdadera, es decir, que la distribución de Poisson con parámetro
ƛ, que es la media de los datos.

Recordemos la media para datos agrupados

Ahora, vamos a calcular probabilidades de errores con la distribución de Poisson con ƛ = 3,05

En la función de probabilidad tenemos

Recordemos que estas probabilidades se pueden obtener fácilmente con la ayuda de la función fx de Excel

Figura 6. Distribución Poisson en Excel


Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 16
Figura 7 Distribución de Poisson en Excel parámetros
Fuente: elaboración propia

En la misma forma completamos las probabilidades

Tabla 5. Ejemplo errores en unidades y probabilidad

Número 0 1 2 3 4 5 6 7 8 9
errores
Frecuencia
observada 18 53 103 107 82 46 18 10 2 1
Oi

P(x) 0,0474 0,1444 0,2203 0,2239 0,1708 0,1042 0,0530 0,0231 0,0088 0,0030

Frecuencia
Esperada 20,8379 63,5557 96,9224 98,5378 75,1351 45,8324 23,2981 10,1513 3,8702 1,3116
Ei

Fuente: elaboración propia

La frecuencia esperada para 0 errores es 440*0,0474 = 20,8379

Y así para el resto de valores.

POLITÉCNICO GRANCOLOMBIANO 17
Ahora observemos que las dos últimas frecuencias esperadas son menores a 5 por lo tanto las unimos
en una sola quedando la tabla:

Tabla 6. Ejemplo errores en unidades y probabilidad ajustada

Número 0 1 2 3 4 5 6 7 8 y más
errores
Frecuencia
observada 18 53 103 107 82 46 18 10 2
Oi

P(x) 0,0474 0,1444 0,2203 0,2239 0,1708 0,1042 0,0530 0,0231 0,0088

Frecuencia
Esperada 20,8379 63,5557 96,9224 98,5378 75,1351 45,8324 23,2981 10,1513 5,1818
Ei

Fuente: elaboración propia

Si aplicamos la estadística de prueba tenemos:

Ahora, encontramos el valor crítico en la distribución chi.cuadrado con (k-p-1) grados de libertad. Es decir:

K número de categorías = 9

P número de parámetros = 1 (la distribución de Poisson solo tiene un parámetro ƛ)

Chi.cuadrado con 7 grados de libertad y nivel de significancia 5%

POLITÉCNICO GRANCOLOMBIANO 18
Tabla 7. Distribución Ji cuadrado

Fuente: Montgomery y Runger, (2002)

Como , es decir, 6,001 < 14,067, se acepta la hipótesis nula Ho

Con un nivel de significancia del 5%, se puede decir que los datos tienen distribución de Poisson.

Llegamos al final de la Lectura fundamental del Escenario 6 en el cual trabajamos hipótesis para dos
muestras y una hipótesis de bondad de ajuste. En el siguiente Escenario vamos a trabajar hipótesis para tres
y más grupos.

POLITÉCNICO GRANCOLOMBIANO 19
Referencias
Gutiérrez, H. & De la Vara, R. (2005). Control estadístico de Calidad y Seis Sigma. México D. F.:
McGrawHill.

Montgomery, D. & Runger, G. (2002). Probabilidad y Estadística aplicadas a la Ingeniería (2 ed.).


Limusa Wiley.

POLITÉCNICO GRANCOLOMBIANO 20
INFORMACIÓN TÉCNICA

Módulo: Estadística Inferencial


Unidad 3: Hipótesis para una y dos muestras
Escenario 6: Prueba de hipótesis en dos muestras

Autor: Patricia Castillo Garzón

Asesor Pedagógico: Miguel Guevara


Diseñador Gráfico: Julieth Rodríguez
Asistente: Ginna Quiroga

Este material pertenece al Politécnico Grancolombiano.


Prohibida su reproducción total o parcial.

POLITÉCNICO GRANCOLOMBIANO 21

También podría gustarte