CartillaS6 PDF

PRUEBA DE HIPÓTESIS
ESTADÍSTICA II
AUTOR: Rogelio Alvarado Martinez
ÍNDICE
Acceso rápido
GENERALIDADES DESARROLLO
GLOSARIO REFERENCIAS
Este material pertenece al Politécnico

Grancolombiano y a la Red Ilumno. Por ende, son
de uso exclusivo de las Instituciones adscritas a
la Red Ilumno. Prohibida su reproducción total
o parcial.
01 ------
Recordemos que para diferencias de medias se utiliza el siguiente estadístico de prueba:
ÍNDICE 𝑋𝑋" − 𝑋𝑋% − (µ" − µ% )

𝑍𝑍 =
2. Prueba de hipótesis 𝜎𝜎"% 𝜎𝜎%%
+
𝑛𝑛" 𝑛𝑛%
2.1 Prueba de hipótesis para la comparación de grupos
2.1.1 Prueba para la diferencia de medias. Muestras grandes Ejemplo (Montgomery 2002)
2.1.2 Prueba para diferencia de medias. Muestras pequeñas Una obra de construcción requiere un gran número de bloques de concreto. Dos empresas
abastecedoras A y B licitan para su adjudicación, y dentro del pliego de condiciones se estipula
2.1.3 Prueba para diferencia de proporciones que la resistencia mínima es de 1.000 unidades métricas a la resistencia, y el contrato se
adjudicará a la empresa que mayor resistencia presente su producto.
2.2 Prueba de hipótesis para la varianza de una población
2.3 Prueba de independencia Paso 1: Se plantea la hipótesis nula (Ho) que no existe diferencia entre las resistencias medias
a la compresión de los bloques de concreto. La hipótesis alternativa se plantea en términos
que hay alguna diferencia significativa entre las dos resistencias medias a la compresión.
DESARROLLO TEMÁTICO Simbólicamente se expresa así:
H o : µ1 = µ2
2. Pruebas de hipótesis
H1 : µ1 ≠ µ2
2.1 Pruebas de hipótesis para la comparación de dos grupos
Muchas veces en el análisis estadístico el interés se centra en la comparación de las medias de Dado que la hipótesis alternativa no indica una dirección específica, la prueba es de dos colas.
dos poblaciones, conocida también como la prueba para diferencia de medias que analizamos en
Paso 2: Se elige un nivel de significancia de 0.01. Esto equivale a cometer un error de tipo I. Se
diferentes contextos.
usará una distribución normal estandarizada en Z, razón por la cual se debe seleccionar una
muestra que al menos contenga como mínimo 30 unidades de bloque, cada una de las empresas
2.1.1 Prueba para la diferencia de medias. Muestras grandes. licitantes.
Es muy común que cuando se quiere hacer comparación de dos grupos a través de las medias no Paso 3: El estadístico de prueba a aplicar está dado por la siguiente fórmula:
se conozcan las varianzas poblacionales, para estos casos es posible obtener las medias
muestrales (𝑋𝑋" − 𝑋𝑋% ) las varianzas muestrales (𝑆𝑆"% 𝑦𝑦 𝑆𝑆%% ) . 𝑍𝑍 =
01 203 2 (µ1 2µ3 )

43 3
1 6 43
Si se supone que las muestras se obtienen de manera aleatoria e independiente a partir de 51 53
las poblaciones respectivas que tiene una distribución normal con varianzas poblacionales
iguales, es decir, 𝜎𝜎"% = 𝜎𝜎%% se puede utilizar una prueba de distribución normal de varianzas
combinadas para determinar si existe una diferencia significativa entre las dos poblaciones.

3 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 4

Suponga que se seleccionó una muestra de cada una de las empresas licitantes y determinó 2.1.2 Prueba para la diferencia de medias. Muestras pequeñas
l a resistencia a la compresión, con los siguientes resultados:
Cuando se quiere probar la diferencia de medias con muestras pequeñas el procedimiento sufre
algunos cambios ya que en los casos en donde los tamaños de muestra eran mayores de 30 se
estimaban las desviaciones estándar de la población con las desviaciones de la muestra, pero para
Licitante A Licitante
𝑋𝑋= 1.020 B muestras pequeñas este procedimiento no es adecuado, ya que aquí se necesita estimar la
𝑋𝑋
= 1.070 varianza común.
n = 81 n = 64
S = 63 S = 57 Suponiendo que las varianzas de las poblaciones son iguales vamos a utilizar la siguiente varianza
ponderada o estimación conjunta de la varianza.
El valor del estadístico de prueba es: %

(𝑛𝑛" − 1)𝑆𝑆"% + (𝑛𝑛% − 1)𝑆𝑆% %
𝑆𝑆@ =
𝑛𝑛" + 𝑛𝑛% − 2
1070 − 1020 − (0 )
𝑍𝑍 =
63% 57% Como se tienen muestras pequeñas y no se conocen las varianzas de la población, se utiliza la
+ distribución t con grados de libertad (𝑛𝑛" + 𝑛𝑛% − 2) que corresponden a las dos muestras.
81 64
Otra diferencia, es la forma como se calcula el error estándar, para obtenerlo utilizamos la
Z = 5,01 siguiente ecuación:
Paso 4. Recuérdese que se seleccionó un nivel de significancia del 0.10 y se utilizará una prueba 𝜎𝜎 " "
A1 2A3 BCD 6
de dos colas. Los valores críticos y zonas de aceptación para las hipótesis se presentan en la E1 E3
siguiente figura:
Ejemplo:
El gerente de una entidad financiera quiere determinar si existen diferencias significativas en el

tiempo de atención de dos cajeros. Una muestra aleatoria de seis clientes atendidos por el cajero
A y de ocho clientes atendidos por el cajero B, da los siguientes resultados. (tiempo en minutos):
Cajero A 5 8 7 6 9 7

Figura 1. Valores críticos distribución normal Cajero B 8 10 7 11 9 12 14 9

Fuente: Elaboración propia (2016)
Paso 5. El valor Z calculado queda en el área de rechazo de la hipótesis nula, por lo tanto, se Paso 1. Planteamiento de las hipótesis:
concluye que la media poblacional de la resistencia a la compresión es diferente en las dos
H o: µ1 = µ2
empresas y la diferencia no se debe al azar del muestreo, con un nivel de significancia del 10%.
H1: µ1 ≠ µ2


Paso 2: Calculamos la media y la desviación estándar para cada muestra, obteniendo:
Analizamos las condiciones:

Cajero A 𝑋𝑋1 = 7 S1=1,4142
• Muestras pequeñas
• Desviaciones estándar de la población desconocidas Cajero B 𝑋𝑋2 = 10 S2 =2,2678
•
Entonces trabajamos con la distribución t
Observamos que n1 = 6 y n2 = 8 entonces los grados de libertad son: Primero calculamos la desviación estándar conjunta en donde:
Gl = (6+8-‐2) = 12 (𝑛𝑛" − 1)𝑆𝑆"% + (𝑛𝑛% − 1)𝑆𝑆% %

𝑆𝑆@ =
𝑛𝑛" + 𝑛𝑛% − 2
Paso 3. Ahora para un nivel de significancia α = 5% buscamos el valor de la tabla t con 14 gl.
(6 − 1)(1,4142)% + (8 − 1)(2,2578)%
𝑆𝑆@ =
12
Sp = 1,9579

Y el error estándar
Figura 2. Valores críticos distribución t

𝜎𝜎 " "
A1 2A3 BCD 6
E1 E3
Los valores críticos son -‐ 2,179 y 2,179
𝜎𝜎 " "

Paso 4. Calculamos la estadística de prueba: A1 2A3 B(",LMNL) 6
O P
X" − X% − (µ" − µ% )
𝑇𝑇 = 𝜎𝜎A1 2A3 B 𝟏𝟏,𝟎𝟎𝟎𝟎𝟎𝟎𝟎𝟎
1 1
SI +
n" n% Ahora reemplazamos en la estadística de prueba:
X" − X% − (µ" − µ% )
𝑇𝑇 =
1 1
SI +
n" n%


7 − 10 − 0 2 hay 200 sanas. Probar la hipótesis que la temperatura más baja favorece la conservación de
𝑇𝑇 =
1,0574 las frutas al nivel de significación de 0.05.
T = -‐2,8371 Paso 1:
Paso 5. Decisión: H o : π1 ≤ π2

H1 : π1 > π2
Tomamos la decisión con la comparación del valor calculado y los puntos críticos.
Paso 2: Utilizando la distribución de probabilidad normal con ensayo unilateral a la derecha con
un nivel significativo de 0.05, el valor crítico es de 1.645.

Paso 3:

0,9 − 0,8 − (0 )
𝑍𝑍 = = 3,12
0,9(1 − 0,9) 0,8(1 − 0,8)
+
Figura 3. Valor calculado y puntos críticos 250 250
Fuente: Elaboración propia (2016) Paso 4: Como 3 . 1 2>1.645 s e r e c h a z a l a h i p ó t e s i s nula y s e a c ep t a l a h i p ót es i s

alternativa.
El valor calculado cae en la zona de rechazo, por lo tanto, la decisión es rechazar la hipótesis Ho.

Con un nivel de significancia del 5% se puede decir que sí existen diferencias significativas en el
tiempo de atención de los dos cajeros. Paso 5: La temperatura más baja favorece la conservación de las frutas.
2.1.3 Prueba de hipótesis para diferencias entre dos proporciones 2.2 Prueba de hipótesis para la varianza de una población
Se presenta a c o n t i n u a c i ó n u n e j e m p l o d o n d e s e e m p l e a l a p r u e b a d e proporción En algunas ocasiones es necesario hacer pruebas con respecto a la variación, para estos casos las
para la diferencia entre dos poblaciones, utilizando el siguiente estadístico de prueba: hipótesis se plantean como en los casos anteriores, es decir, la prueba puede ser unilateral o
bilateral, pero en este caso es importante tener presente algunos supuestos:
𝑃𝑃" − 𝑃𝑃% − (π" − π% )
𝑍𝑍 = -‐ La muestra es aleatoria.
𝑃𝑃" (1 − 𝑃𝑃" ) 𝑃𝑃% (1 − 𝑃𝑃% )
+ -‐ La población es normal.
𝑛𝑛" 𝑛𝑛%
E2" C 3
-‐ La estadística de prueba 𝑋𝑋 % = tiene una distribución Chi-‐cuadrado con (n-‐1)
XY3
grados de libertad. En esta fórmula 𝜎𝜎Z es el valor de hipótesis.
Ejemplo (Gutiérrez 2005):

Dos lotes de frutas conformados cada uno por 250 unidades, son tratados y almacenados en
iguales condiciones, salvo que el lote No 1 está a temperatura ligeramente inferior que el lote
No 2. Pasado un tiempo se encuentra que en el lote No 1 hay 225 frutas sanas y en el lote No


La distribución chi-‐ cuadrado, a diferencia de la normal, no es una distribución simétrica, todos
sus valores son positivos y encontramos tablas para todos los grados de libertad.
La forma de la distribución es:
Figura 5. Valor crítico distribución chi-cuadrado

Figura 4 Distribución chi-cuadrado Paso 5: Decisión.
Fuente: Elaboración propia (2016) Como el valor calculado 29,25 es mayor al valor de la tabla, se rechaza la hipótesis nula, entonces
con un nivel de significancia del 5%, se puede decir que la variación si ha aumentado confirmando
Ejemplo: la creencia del psicólogo.
Se sabe que una prueba de razonamiento tiene una distribución normal con una media de 100 y
2.3 Prueba de independencia
una desviación estándar de 10. Un psicólogo cree que la variación de los resultados ha aumentado
en las últimas pruebas, para probar esto toma una muestra de 14 personas y obtiene un puntaje Hasta ahora hemos calculado pruebas de hipótesis con respecto a los parámetros de la población,
con una desviación estándar de 15. ¿Estos datos son suficiente evidencia para aceptar la creencia pero esto no quiere decir que sea la única forma de presentar la hipótesis nula, veamos qué
del psicólogo? Nivel de significancia 5% ocurre en situaciones como la del siguiente ejemplo:
Paso 1: planteamiento de la hipótesis Una empresa saca al mercado tres tipos de cerveza: negra, blanca y dorada. En un estudio de
segmentación de mercados, el grupo investigador tiene la duda si la preferencia de las tres
Ho: 𝜎𝜎 % ≤ 10% (La hipótesis está planteada para la varianza)
cervezas es diferente para hombres y mujeres, si la preferencia de la cerveza es independiente
H1: 𝜎𝜎 % > 10% del sexo de los consumidores se iniciaría una campaña para todos los consumidores, sin embargo,
si la preferencia depende del sexo del consumidor, se haría una campaña publicitaria para
Paso 2: hombres y una para mujeres.
Tenemos n = 14 S = 15 y 𝜎𝜎Z = 10 Aquí tenemos entonces dos variables involucradas, preferencia de la cerveza y sexo de las
personas. Nos preguntamos entonces ¿existe alguna relación entre las dos variables? O que es lo
Paso 3: Estadística de prueba mismo ¿la preferencia de la cerveza depende del sexo del consumidor?
E2" C 3 "]2" "M3 Para responder a estas preguntas vamos a realizar una prueba de independencia. Primero
𝑋𝑋 % = 𝑋𝑋 % = = 29,25
XY3 "Z3
planteamos las hipótesis:
Paso 4: De acuerdo al nivel de significancia del 5% ubicamos el valor crítico en la distribución chi-‐ Paso 1:
cuadrado con (n-‐1) = 13 grados de libertad. X2= 22,362
Ho: La preferencia de la cerveza es independiente del sexo del consumidor
H1: La preferencia de la cerveza no es independiente del sexo del consumidor.


40 (70) *(80) /150 = 37.33
Una vez identificadas las hipótesis se toma una muestra y se clasifica la información de la siguiente
forma:
30 (70) *(70) /150 = 32,67

20 (50) *(80) /150 = 26,67
Cerveza preferida
30 (50) *(70) /150 = 23,33
Total
Negra Blanca Dorada
S Tabla 2. Datos observaos y esperados
E Fuente: elaboración propia (2016)

Hombre 20 40 20 80
X

O
Mujer 10 30 30 70 La tabla de frecuencias esperadas queda entonces:

Total 30 70 50 150
Cerveza preferida
Tabla 1. Datos ejemplo independencia
Total
Fuente: elaboración propia (2016) S
Negra Blanca Dorada
E
Hombre 16 37,33 26,67 80
X
La tabla nos muestra las frecuencias observadas, ahora vamos a calcular las frecuencias esperadas
multiplicando el total de columna por el total de fila y dividiendo el resultado sobre el total de la O
Mujer 14 32,67 23,33 70
siguiente manera:
Total 30 70 50 150

Tabla 3. Tabla frecuencias esperadas
Valor observado Valor esperado
Fuente: elaboración propia (2016)
20 (30) *(80) /150 =16

10 (30) *(70) /150= 14


Paso 2: En este caso, 6,13 es mayor que 5,991, entonces se rechaza Ho: La preferencia de la cerveza es
independiente del sexo del consumidor.
Una vez tenemos las frecuencias observadas (O) y las esperadas (E) calculamos la estadística de
prueba: Por lo tanto, se puede decir con un nivel de significancia del 5%, que la cerveza preferida no es
independiente del sexo del consumidor.
(^2_)3
Χ2 =
_

Esta expresión tiene distribución Ji-‐cuadrado con grados de libertad (r-‐1) (k-‐1) siendo r el número
En conclusión, en una prueba de independencia entre dos variables se debe
de filas y k el número de columnas.
• Primero, plantear las hipótesis:
Para esta tabla los grados de libertad son: (2-‐1) (3-‐1) = 2.
(%Z2"O)3 ("Z2"])3 ]Z2`N,`` 3 (`Z2`%,ON)3 (%Z2%O,ON)3 (`Z2%`,``)3

Ho: Las dos variables son independientes
𝑋𝑋 % = + + + + +
"O "] `N,`` `%,ON %O,ON %`,``
H1: Las dos variables no son independientes
2
X = 6,13

Paso 3: • Después tomar una muestra aleatoria y construir una tabla de doble entrada con las
frecuencias observadas
Ubicamos el valor crítico en la tabla ji-‐cuadrado con 2 grados de libertad y fijamos un nivel de
significancia del 5%. • Después calcular las frecuencias esperadas y construir la estadística de prueba X2
%
Valor de la tabla 𝑋𝑋Z,ZM = 5,991 • Por último, aplicar la regla de rechazo.
Paso 4:
% %
Decisión. Regla de decisión se rechaza Ho si 𝑋𝑋abcadcbef > 𝑋𝑋gbhcb
EJEMPLIFICACIÓN DE LA TEMÁTICA
1. Un gerente afirma que el tiempo que gastan los empleados del turno del día en realizar un
trabajo específico, excede a los tiempos empleados por los del turno de la noche, en al menos
12 minutos. Para probar dicha afirmación, se prueban 50 empleados de cada turno bajo
condiciones similares. En el turno del día el tiempo promedio es de 86.7 minutos con una
desviación estándar de 6.28 minutos, mientras que en el de la noche el tiempo promedio es
de 77.8 minutos con una desviación estándar de 5.61 minutos. Pruebe la afirmación del

gerente usando un nivel de significancia de 0.01.
Figura 6: Valor calculado y valor crítico distribución chi-cuadrado

Fuente: Elaboración propia (2016) 2. Un director de manufactura debe decidir cuál de las dos plantas debe responsabilizarse de
producir corchos para el vino utilizados en una famosa marca. Esta decisión se fundamentará
por los niveles de productividad. Una muestra de 67 días en la planta de Cali produjo una


media de 92.2 millones de corchos por día con una desviación estándar de 12.2 millones. La
planta de Medellín produjo un promedio de 89.2 millones de corchos con una varianza de 20 – 30 35 22 28 15
237.16 millones de pesos2 durante 54 días. ¿Con un nivel de significancia del 5%, se puede
decir que hay diferencias significativas en los niveles de productividad?
Mayor a 30 8 10 40 12
3. (Montgomery 2002) Se considera cierto cambio en un proceso de fabricación de partes
componentes. Se toman muestras del procedimiento actual y del nuevo, para determinar si
el nuevo tiene como resultado una mejoría. Si se encuentra que 75 de 1500 artículos del Total
procedimiento actual son defectuosos y 80 de 2000 artículos del procedimiento nuevo
también lo son, encuentre un nivel de significancia del 1% y determine si el cambio fue
Tabla 4. Datos ejercicio 5
efectivo.
4. (Montgomery 2002) Se tienen dos proveedores de una pieza metálica y se quiere determinar Fuente: elaboración propia (2016)
si el diámetro promedio tiene diferencias significativas, para probar esto se toman muestras
Pruebe la hipótesis con un nivel de significancia del 5%.
de cada proveedor y se obtienen los siguientes resultados:

Proveedor 1 21.38 20.13 19.12 20.54 18.60 18.10

Proveedor 2 21.51 22.22 21.52 22.06 21.29 22.71

Asumiendo varianzas de las poblaciones desconocidas pero iguales, pruebe la hipótesis con un
nivel de significancia del 5%.

1. Una agencia que vende vehículos quiere determinar si existe alguna relación entre la edad
de los clientes y el color del vehículo elegido. Toma una muestra y obtiene la siguiente
información:

Edad (años) Color elegido Total

Blanco Rojo Gris Negro

Menor a 20 25 30 15 10


03 -------
GLOSARIO DE TÉRMINOS 5. BIBLIOGRAFÍA
Error tipo I: probabilidad de rechazar la hipótesis nula cuando es cierta.
Hipótesis estadística: supuesto o afirmación de los parámetros de la población.
5.1 Textos
04 -----
• GUTIERREZ, H. y. (2005). Control estadístico de Calidad y Seis Sigma. McGrawHill.
Hipótesis nula: afirmación sobre la que se toma la decisión. • FREUND John E., M. I. (2000). Estadística Matemática con aplicaciones (6 ed.). Prentice
Hall.
Hipótesis alterna: supuesto que se quiere probar.
• WALPOLE Ronal E., M. R. (1998). Probabilidad y Estadística para Ingenieros (6 ed.).
Nivel de significancia: Error tipo I. Prentice Hall.
• KENNET, R. S. (2000). Estadística Industrial Moderna. Thomsom.
Valor o punto crítico: valor de la distribución que separa la zona de rechazo y la de no rechazo.
• Paul, N. (1988). Estadística para los Negocios y la Economía (4 ed.). Prentice Hall.

• C MONTGOMERY, D. C. (2002). Probabilidad y Estadística aplicadas a la Ingeniería (2
ed.). Limusa Wiley.
5.2 Lista de figuras
Figura 1. Valores críticos distribución normal
Figura 2. Valores críticos distribución t
Figura 3. Valor calculado y puntos críticos
Figura 4 Distribución chi-‐cuadrado
Figura 5. Valor crítico distribución chi-‐cuadrado
Figura 6: Valor calculado y valor crítico distribución chi-‐cuadrado


POLITÉCNICO GRANCOLOMBIANO - 2016 ©

CartillaS6 PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

CartillaS6 PDF

Cargado por

Copyright:

Formatos disponibles

PRUEBA DE HIPÓTESIS

Este material pertenece al Politécnico

ÍNDICE 𝑋𝑋" − 𝑋𝑋% − (µ" − µ% )

3 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 4

El valor del estadístico de prueba es: %

El gerente de una entidad financiera quiere determinar si existen diferencias significativas en el

Figura 1. Valores críticos distribución normal Cajero B 8 10 7 11 9 12 14 9

5 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 6

Analizamos las condiciones:

Entonces trabajamos con la distribución t

Gl = (6+8-­‐2) = 12 (𝑛𝑛" − 1)𝑆𝑆"% + (𝑛𝑛% − 1)𝑆𝑆% %

Fuente: Elaboración propia (2016)

7 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 8

T = -­‐2,8371 Paso 1:

Paso 5. Decisión: H o : π1 ≤ π2

Fuente: Elaboración propia (2016) Paso 4: Como 3 . 1 2>1.645 s e r e c h a z a l a h i p ó t e s i s nula y s e a c ep t a l a h i p ót es i s

9 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 10

La forma de la distribución es:

Figura 5. Valor crítico distribución chi-cuadrado

Fuente: Elaboración propia (2016)

Figura 4 Distribución chi-cuadrado Paso 5: Decisión.

11 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 12

20 (50) *(80) /150 = 26,67

E Fuente: elaboración propia (2016)

20 (30) *(80) /150 =16

13 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 14

(%Z2"O)3 ("Z2"])3 ]Z2`N,`` 3 (`Z2`%,ON)3 (%Z2%O,ON)3 (`Z2%`,``)3

EJEMPLIFICACIÓN DE LA TEMÁTICA

15 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 16

17 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 18

5.2 Lista de figuras

Figura 1. Valores críticos distribución normal

Figura 2. Valores críticos distribución t

Figura 3. Valor calculado y puntos críticos

Figura 4 Distribución chi-­‐cuadrado

Figura 5. Valor crítico distribución chi-­‐cuadrado

Figura 6: Valor calculado y valor crítico distribución chi-­‐cuadrado

19 POLITÉCNICO GRANCOLOMBIANO ESTADÍSTICA II 20

También podría gustarte

Gl = (6+8-‐2) = 12 (𝑛𝑛" − 1)𝑆𝑆"% + (𝑛𝑛% − 1)𝑆𝑆% %

T = -‐2,8371 Paso 1:

Figura 4 Distribución chi-‐cuadrado

Figura 5. Valor crítico distribución chi-‐cuadrado

Figura 6: Valor calculado y valor crítico distribución chi-‐cuadrado