Está en la página 1de 25

LECTURA N° 12

PRUEBA DE HIPOTESIS PARA


DOS MUESTRAS

1
PRUEBA DE HIPOTESIS SOBRE LA MEDIA POBLACIONAL

Hipótesis Estadística
Se denomina hipótesis estadística, a cualquier afirmación, supuesto o conjetura
que se hace acerca de la distribución de una o más poblaciones.
En término sencillo, las hipótesis estadísticas consisten en suponer que los
parámetros, que definen a la población, toman determinados valores numéricos.
Ejemplo 1.
Una hipótesis podría ser que la comisión media de los vendedores de
computadoras en la ciudad de Lima es de S/.1000. No es posible entrevistar a
todos los agentes para determinar si la media en realidad es S/.1000. El costo de
localizar e interrogar a cada vendedor de computadoras en la ciudad de Lima seria
exorbitante. Para probar la validez de la afirmación (µ=S/.1000), debe seleccionar
una muestra de la población formada por vendedores de computadoras, calcular
valores estadísticos muestrales y con base a determinadas reglas de decisión
aceptar o rechazar la hipótesis.
Ejemplo 2.
Son hipótesis estadísticas:
1. La longitud media de un tipo de madera es 10 centímetros.
2. La proporción de objetos defectuosos producidos por cierto proceso nunca
es superior al 8%.
3. La varianza de la longitud de cierto tipo de alambre es 0.25 cm 2.
4. Son iguales las medias de dos tipos de mediciones independientes X e Y
que se distribuyen normalmente con varianza común σ 2.

El análisis estadístico de los datos servirá para determinar si se rechaza o no se


rechaza la hipótesis nula.
Cuando se rechaza la hipótesis nula, significa que el factor estudiado ha influido
significativamente en los resultados y es información relevante para apoyar la
hipótesis de investigación planteada.
Es muy importante tener presente que la hipótesis de investigación debe coincidir
con la hipótesis alterna. Plantear hipótesis de investigación que coincidan con la
hipótesis nula supondría una aplicación incorrecta del razonamiento estadístico.
2
Hipótesis nula y alternativa
Se denomina hipótesis nula y se representa por H0 a la hipótesis que es
aceptada provisionalmente como verdadera y cuya validez será sometida a
comprobación experimental. Los resultados experimentales nos permitirán seguir
aceptándola como verdadera, o si por el contrario debemos rechazarla como tal.
Toda hipótesis nula va acompañada de otra hipótesis alternativa.

Se denomina hipótesis alterna y se representa por H1 o por Ha a la hipótesis que


se acepta en caso de que la hipótesis nula H 0 sea rechazada. La hipótesis
alternativa Ha, es pues una suposición contraria a la hipótesis nula. La hipótesis
nula y la hipótesis alterna o de investigación son mutuamente excluyentes.

Tipos de prueba de hipótesis


El tipo de prueba depende básicamente de la hipótesis alternativa H a.
Se denomina prueba de una cola a toda prueba de hipótesis donde la hipótesis
alternativa Ha es unilateral. Si Ha es bilateral, la prueba se denomina prueba de
dos colas; luego para un parámetro θ=X se tiene que:

1. La prueba de hipótesis H0: θ= θ0 contra H1: θ≠ θ0 se denomina PRUEBA


BILATERAL O DE DOS COLAS

2. La prueba de hipótesis H0: θ= θ0 contra H1: θ> θ0 se denomina PRUEBA


UNILATERAL DE COLA A LA DERECHA
3
3. La prueba de hipótesis H0: θ= θ0 contra H1: θ< θ0 se denomina PRUEBA
UNILATERAL DE COLA A LA IZQUIERDA

Procedimiento de la prueba de hipótesis


Previamente debe formularse el problema estadístico, determinar la variable en
estudio y el método estadístico adecuado para la solución del problema. El
procedimiento general de la prueba de una hipótesis de parámetro θ se reduce en
los siguientes pasos:
1. Plantear la hipótesis nula y la hipótesis alterna
El primer paso es plantear la hipótesis que ha de ser probada. A esta
hipótesis se le denomina hipótesis nula, se le designa mediante H 0 y se lee
“H subíndice cero, donde la letra H significa hipótesis y el subíndice cero
indica que no hay diferencia”. Por lo general la hipótesis nula se plantea con
el objetivo de realizar una prueba, podemos aceptarla o rechazarla. La
hipótesis nula es una afirmación que no se rechaza a menos que los datos
muestrales proporcionen evidencia convincente de que es falsa.

4
La hipótesis alterna describe lo que se concluirá si se rechaza la hipótesis
nula, se designa por Ha y se lee “H subíndice a”. Se le conoce también
como hipótesis de investigación, esta se acepta si los datos muestrales
proporcionan suficiente evidencia estadística de que la hipótesis nula es
falsa. Otra notación que se utiliza para denotar la hipótesis alternativa está
dada por H1.
Es importante anotar que sin importar como se haya planteado el problema,
la hipótesis nula siempre incluirá el signo igual (=). Este signo nunca
aparecerá en la hipótesis alternativa pues la hipótesis nula es la afirmación
a probar, y al realizar los cálculos se requiere de un valor específico. Se
recurre a la hipótesis alterna solo si se verifica que la hipótesis nula es
falsa.

2. Seleccionar el nivel de significancia


Después de establecer la hipótesis nula y alterna, el siguiente paso es
determinar el nivel de significancia, que es la probabilidad de rechazar la
hipótesis nula cuando es verdadera. El nivel de significancia se denota
mediante la letra griega alfa (α). En algunas ocasiones se le conoce
también como nivel de riesgo. Este último es un término más adecuado, ya
que es el riesgo que se corre de rechazar la hipótesis nula cuando esta es
verdadera. No existe un nivel de significancia que se aplique a todas las
pruebas. Se usa frecuentemente el nivel α=0.05 o α=5%, o cualquier otro
nivel comprendido entre 0 y 1.
Tradicionalmente se utiliza el nivel del 5% para proyectos de investigación
sobre consumo, el nivel del 1% para el aseguramiento de calidad y el 10%
para encuestas políticas. El investigador debe decidir qué nivel de
significancia usar antes de formular una regla de decisión y recopilar los
datos muestrales.

5
3. Seleccionar el estadístico de prueba
Estadístico para la media:

PRUEBA DE HIPOTESIS PARA LA MEDIA


Ejemplo 1.
Una empresa eléctrica fabrica focos que tienen duración que se distribuyen
normalmente con una media de 800 horas y una desviación típica de 40 horas. Si
una muestra aleatoria de 40 focos tiene una duración promedio de 788 horas,
¿muestran los datos suficiente evidencia para decir que la duración media de los
focos ha cambiado? Utilice un nivel de significancia del 0.04
Solución:
Se trata de una distribución muestral de medias con desviación estándar conocida.
Datos: µ = 800 horas, σ = 40 horas, = 788 horas, n = 40, α = 0.04

1. Planteo de hipótesis:
H0 : µ = 800
H1 : µ ≠ 800
2. Nivel de significancia: α = 0.04
3. Estadístico de la prueba:

Z 
X  μ 6

n
4. Determinación de la región critica de la prueba:

5. Calculo del estadístico:

Z
 X  μ   788 - 800  -1.897
 40
n
6. Conclusión: 40

Como -2.052 < -1.897 < 2.052 (cae en la región de aceptación) por lo tanto,
no se rechaza H0 y se concluye con un nivel de significancia del 0.04 que la
duración media de los focos no ha cambiado.

Ejemplo 2.
Estamos interesados en estudiar si existen diferencias significativas en el tiempo
medio de experiencia previa de los empleados de cierta empresa. Por ello
supongamos que dicho valor es igual a 110 meses con un nivel de confianza del
95%. Para ello utilice los siguientes reportes de SPSS:
Estadísticos para una muestra

7
Nota: Para los reportes de salida del programa SPSS, le damos la siguiente
ruta:
Analizar / Comparación de medias / Prueba T para una muestra / test value =
110
Solución:
1. Planteo de hipótesis:
H0 : µ = 110
H1 : µ ≠ 110
2. Nivel de significancia: α = 0.05
3. Tipo de prueba: t de student
4. Comprobando hipótesis:

5. Conclusión:

8
Como el valor de p=0.003 y es menor que el nivel de significación α = 0.05
rechazamos la hipótesis nula, lo que implica que aceptamos la hipótesis
alterna. Por lo tanto concluimos que a un nivel de significancia del 5%, que
el tiempo medio de la experiencia previa de los empleados es diferente a
110 meses y la probabilidad de equivocarnos en tomar esta decisión es del
0.3%.

PRUEBAS DE HIPÓTESIS SOBRE LA IGUALDAD DE DOS MEDIAS.

A) Varianzas conocidas

Supóngase que hay dos poblaciones de interés X 1 y X2, Suponemos que X1 tiene
media desconocida 1 y varianza conocida  1 y que X2 tiene media desconocida
2

 2 y varianza conocida  2 2 . Estaremos interesados en la prueba de la hipótesis


de que las medias 1 y  2 sean iguales.

Considérense primero las hipótesis alternativas de dos lados:

H 0 : 1   2
H1 : 1   2

Donde

H0 = Hipótesis nula

H1 = Hipótesis alternativa.

1 = media de la población 1

 2 = media de la población 2

El procedimiento para probar H 0 : 1   2 es calcular la estadística de prueba Z0


mediante la siguiente fórmula:

9
X1  X 2
Z0 
 21  2 2

n1 n2

Donde:

X 1 = media de la muestra 1

X 2 = media de la muestra 2

 21 = varianza de la población 1

 2 2 = varianza de la población 2
n1 = tamaño de la muestra 1

n2 = tamaño de la muestra 2

La hipótesis nula H0 se rechaza si:

Z 0  Z 2 o Z 0  Z 2

Donde

Z0 = Valor calculado del estadístico de prueba

Z 2 = Valor obtenido de las tablas.

Las hipótesis alternativas de un lado se analizan de manera similar. Para probar

H 0 : 1   2

H 1 : 1   2

Se calcula la estadística de prueba Z0 , y se rechaza H 0 : 1   2 si Z 0  Z  .

Para probar las otras hipótesis alternativas de un lado

10
H 0 : 1   2

H 1 : 1   2

Se utiliza la estadística de prueba Z0 y se rechaza H 0 : 1   2 si Z 0   Z 

11
Ejemplo 6:

Se emplean dos máquinas para llenar botellas de plástico con un volumen neto de
16 onzas. El proceso de llenado puede suponerse normal, con desviaciones
estándar de  1  .015 y  2  .018 . Ingeniería de calidad sospecha que ambas
máquinas llenan hasta el mismo volumen neto, sin importar que este volumen sea
o no de 16 onzas. Se toma una muestra aleatoria de la salida de cada máquina.

¿Piensa usted que ingeniería de calidad está en lo correcto? Utilizando   .05 .

máquina 1 máquina 2
16.03 16.02
16.04 15.97
16.05 15.96
16.05 16.01
16.02 15.99
16.01 16.03
15.96 16.04
15.98 16.02
16.02 16.01
15.99 16

H 0 : 1   2

H 1 : 1   2

Calculando las medias de cada máquina obtenemos X 1  16.015, X 2  16.005 .

X1  X 2 16.015  16.005
Z0   1.34
 1  2 = .015 2 .018 2
2 2
 
n1 n2 10 10

Z 2 = Z.025 = 1.96

El uso de la tabla es el siguiente:

12
1-.025 =.975 buscando el valor de Z correspondiente a .975 encontramos Z =
1.96

Utilizando el criterio de decisión Z 0  Z  2 para rechazar la hipótesis nula H 0, nos


damos cuenta de que 1.34 no es mayor que 1.96. por lo cual no rechazamos H 0.
No existe suficiente evidencia estadística para pensar que las medias son
diferentes.

Cuando rechazamos la hipótesis nula se considera que la prueba es potente, si


aceptáramos la hipótesis nula el criterio de decisión es débil, ya que generalmente
se busca rechazar H0.
PROCEDIMIENTO EN EXCEL
Seleccionar análisis de datos en el menú herramientas. En funciones para
análisis elija la opción : Prueba z para medias de dos muestras.
PRUEBAS PARA LA IGUALDAD DE DOS VARIANZAS.

Presentaremos ahora pruebas para comparar dos varianzas. Supóngase que son
dos las poblaciones de interés, por ejemplo X 1 y X2, donde 1, 1 ,  2 ,  2 , se
2 2

desconocen. Deseamos probar hipótesis relativas a la igualdad de las dos


varianzas, H 0 :  1   2 . Considérese que se disponen dos muestras aleatorias de
2 2

13
tamaño n1 de la población 1 y de tamaño n2 de la población 2, y sean S12 yS 22 las
varianzas de muestra. Para probar la alternativa de dos lados

H 0 :  12   22

H 1 :  12   22

Utilizamos el hecho de que la estadística

S12
F0  2
S2

Se distribuye como F, con n1-1 y n2 –1 grados de libertad.

Rechazaríamos H0 si

F0  F 2 , n1 1, n 2 1

o si
F0  F1 2 , n1 1, n2 1

Donde F 2 ,n1 1,n2 1 y F1 2 ,n1 1,n2 1 son los puntos porcentuales  2 superior e
inferior de la distribución F con n1-1 y n2-2 grados de libertad. La tabla F
proporciona sólo los puntos de la cola superior de F, por lo que para determinar
F1 2 ,n 1,n 1 debemos emplear
1 2

1
F1 2 , n1 1, n2 1 = F
 2 , n1 1, n2 1

La misma estadística de prueba puede utilizarse para probar hipótesis alternativas


de un lado. La hipótesis alternativa de un lado es:

H 0 :  12   22

H 1 :  12   22

Si F0  F ,n1 1,n2 1 , rechazaríamos H 0 :  12   22 .

14
Ejemplo 7: Los siguientes son tiempos de quemado (en minutos) de señales
luminosas de dos tipos diferentes.

Tipo 1 Tipo 2
63 64
81 72
57 83
66 59
82 65
82 56
68 63
59 74
75 82
73 82

Pruebe la hipótesis de que las dos varianzas sean iguales. Use   .05

H 0 :  12   22

H 1 :  12   22

X 1  70.6
X 2  70
S12  88.71
S 22  100.44

S12 88.71
F0  =  .877
S 22 100.44

F 2 , n1 1, n2 1 = F.025,9,9= 4.03

F1 2 , n1 1, n2 1 =.248

.877 no es mayor que 4.03, por lo cual no se rechaza la hipótesis nula

H 0 :  12   22 .

15
PROCEDIMIENTO EN EXCEL: Seleccionar análisis de datos en el menú
herramientas. En funciones para análisis elija la opción : Prueba F para
varianzas de dos muestras.

16
Prueba F para varianzas de dos muestras

Variable 1 Variable 2
Media 70.6 70
Varianza 88.7111111 100.444444
Observaciones 10 10
Grados de libertad 9 9
F 0.88318584
P(F<=f) una cola 0.42811371
Valor crítico para F (una cola) 0.2483862

De la tabla deducimos que .248 es menor que .883 por lo cual no rechazamos H 0.

En la tablazde
Prueba Excel
para tenemos
medias el valor z = 1.34 y el valor crítico de z (dos colas) =
de dos muestras
1.96, como 1.34 no es mayor que 1.96 no rechazamos la hipótesis nula.
B) Varianzas desconocidas: Variable 1 Variable 2
Media 16.015 16.005
Varianza (conocida) 0.000225 0.000324
Consideraremos ahora pruebas de hipótesis respecto a la igualdad de las medias
1 yObservaciones
 2 de dos distribuciones normales donde no 10
se conocen10
las varianzas  12 y 22 .
Diferencia hipotética de las medias 0
Tenemos
z dos casos en el primero las varianzas
1.34962722son iguales y en el segundo las
varianzas
P(Z<=z)sonuna desiguales,
cola a continuación, analizaremos cada uno de ellos.
0.08856785
Valor crítico de z (una cola) 1.644853
Caso 1 varianzas
Valor iguales
crítico de z (dos colas) 0.17713571
Sean X1 ycrítico
Valor X2 dosde zpoblaciones
(dos colas) normales1.95996108
independientes con medias desconocidas
1 y 2 , y varianzas conocidas pero iguales  12   22   2 . Deseamos probar:

H 0 : 1   2
H 1 : 1   2

2 2
Sean X1, X2, S1 , S 2 , las medias y las varianzas de las muestras, respectivamente.
2 2
Puesto que tanto S1 como S 2 estiman la varianza común  , podemos
2

combinarlas para producir una sola estimación, mediante la siguiente fórmula:

 n1  1 S12   n2  1 S 22
Sp 
n1  n2  2

Para probar H 0 : 1   2 calcúlese la estadística de prueba


X1  X 2
t0 
1 1
Sp 
n1 n 2
Si t 0  t 2, n1  n2  2 o si t 0  t 2,n1  n2  2 , rechazamos H 0 : 1   2
Las alternativas de un lado se tratan de modo similar. Para probar:

17
H 0 : 1   2
H 1 : 1   2
Calcúlese la estadística de prueba t0 y rechácese H 0 : 1   2 si:

t 0  t , n1  n2  2

Para la otra alternativa de un lado,

H 0 : 1   2
H 1 : 1   2

Calcúlese la estadística de prueba y rechácese H 0 : 1   2 si:

t 0  t a , n1  n2  2

Ejemplo 8: Se está investigando la resistencia de dos alambres, con la siguiente


información de muestra.

Alambre Resistencia (ohms)


1 .140 .141 .139 .140 .138 .144
2 .135 .138 .140 .139 - -

Suponiendo que las dos varianzas son iguales, ¿qué conclusiones puede
extraerse respecto a la resistencia media de los alambres?
H 0 : 1   2
H 1 : 1   2
Calculando la media y la desviación estándar de la muestra:

x1  .140
x 2  .138
S1  .0021
S 2  .0022

 n1  1 S12   n2  1 S 22
Sp  = .0021
n1  n2  2

X1  X 2
t0 
1 1 = 1.72
Sp 
n1 n 2

Buscamos en la tabla de distribución t el valor t 2, n1  n2 , 2 = t.025,8 =2.306

18
Utilizando el criterio de rechazo t 0  t 2, n1  n2  2 , 1.72 no es mayor que 2.306, por
lo tanto no rechazamos H0.
PROCEDIMIENTO EN EXCEL
Seleccionar análisis de datos en el menú herramientas. En funciones para
análisis elija la opción: Prueba t para dos muestras suponiendo varianzas
iguales.

En la tabla de Excel encontramos los valores deseados: 1.72 no es mayor que


2.306 por lo cual no rechazamos Ho.
Caso 2 Varianzas diferentes

Cuando las varianzas  12 y 22 son diferentes utilizamos la estadística de prueba:

X1  X 2
t0 
S12 S 22

n1 n2

Para el calculo de lo grados de libertad utilizamos:

19
2
 S12 S 22 
  
  n1 n 2  2
 S12 n1  2   S 22 n2  2
n1  1 n2  1

El procedimiento para llevar a cabo la prueba de hipótesis es el mismo que el caso


1, varianzas iguales excepto que se emplean t 0 como estadística de prueba y n 1 +
n2 -2 se sustituye por  en la determinación de los grados de libertad para la
prueba.

Ejemplo 9: Se están investigando dos métodos para producir gasolina a partir de


petróleo crudo. Se supone que el rendimiento de ambos procesos se distribuye
normalmente. Los siguientes datos de rendimiento se han obtenido de la planta
piloto.

Proceso Rendimiento %
1 24.2 26.6 25.7 24.8 25.9 26.5
2 21.0 22.1 21.8 20.9 22.4 22.0
¿Hay alguna razón para creer que el proceso 1 tiene un rendimiento medio
mayor?

H 0 : 1   2
H 1 : 1   2

Calculamos la media y la varianza para ambos procesos:

x1  25.62
x 2  21.70
S12  .9017
S 22  .3760

X1  X 2
25.62  21.70
t0   8.48
2 2
S S = .9017 .376
1
 2 
n1 n2 6 6

2
 S12 S 22   .9017 .376 
2
     
  n1 n 2   2  6 6 
 2  9.32  9
=
 S12 n1  2   S 22 n2  2  .9017 6 2   .376 6 2
n1  1 n2  1 7 7

20
Buscando el valor en la tabla t encontramos t .05,9 = 1,833, mediante el criterio de
rechazo para una cola t0>t.05,9 , 8.48>1.833, por lo tanto rechazamos la hipótesis
nula, y aceptamos la hipótesis alterna, el proceso 1 tiene mayor rendimiento que
el proceso 2.

PROCEDIMIENTO EN EXCEL
Seleccionar análisis de datos en el menú herramientas. En funciones para
análisis elija la opción : Prueba t para dos muestras suponiendo varianzas
desiguales.

Prueba t para dos muestras suponiendo varianzas desiguales

Variable 1 Variable 2
Media 25.61666667 21.7
Varianza 0.901666667 0.376
Observaciones 6 6
Diferencia hipotética de las medias 0
Grados de libertad 9
Estadístico t 8.487571675
P(T<=t) una cola 6.87798E-06
Valor crítico de t (una cola) 1.833113856
P(T<=t) dos colas 1.3756E-05
Valor crítico de t (dos colas) 2.262158887

21
8.48 mayor que 1.83 (valor crítico de t de una cola), se rechaza Ho.

PRUEBA T POR PARES

Cuando es posible resulta ventajoso utilizar muestras pareadas en las pruebas de


comparación. En una prueba de comparación pareada, la reducción en la
variabilidad experimental puede permitir la detección de pequeños movimientos en
los datos.
A pesar de que los grados de libertad sean reducidos, porque ahora el tamaño de
muestra corresponde al número de comparaciones.
Un ejemplo de este tipo de prueba es la evaluación de dos piezas de equipo de
inspección para determinar si existe alguna diferencia significativa entre los
equipos.
Las hipótesis de prueba en torno a la igualdad 1 y 2 pueden realizarse
efectuando una prueba t de una muestra en  D . Específicamente, probar
H 0 : 1   2 contra H 1 : 1   2 es equivalente a probar

H0 : D  0
H1 :  D   0

La estadística de prueba apropiada es

D
t0 
SD n

donde
D
D j

n
y

D j  D
2

SD 
n 1

Rechazaríamos H 0 :  D  0 si t 0  t 2,n 1 o si t 0  t 2 , n 1 , las alternativas de un lado se


tratarían de manera similar.

Ejemplo 6:

Un fabricante desea comparar el proceso de armado común para uno de sus productos con
un método propuesto que supuestamente reduce el tiempo de armado. Se seleccionaron
Trabajador Proceso actual Proceso propuesto
ocho trabajadores
1
de38la planta de armado
30
y se les pidió que armaran las unidades con ambos
procesos.
2 Los siguientes
32 son los tiempos
32 observados en minutos.
3 41 34
4 35 37
5 42 35 22
6 32 26
7 45 38
8 37 32
En   .05 , ¿existe alguna razón para creer que el tiempo de armado para el proceso actual
es mayor que el del método propuesto por más de dos minutos?

H0 : D  2
H1 :  D  2

Trabajador Proceso actual Proceso propuesto Dj (Dj-D)^2


1 38 30 8 10.5625
2 32 32 0 22.5625
3 41 34 7 5.0625
4 35 37 -2 45.5625
5 42 35 7 5.0625
6 32 26 6 1.5625
D

7 Dj
= 4.75
45 38 7 5.0625
8n 37 32 5 0.0625
4.75 95.5

D j  D
2

= 3.69
SD 
n 1

D 4.75  2
t0  = = 2.107
SD n 3.69 8

t ,n 1  t .05, 7  1.895
, debido a que 2.107 > 1.895 rechazamos H0, y aceptamos la H1: el
tiempo de armado para el proceso actual es mayor en dos minutos que el método propuesto.

PROCEDIMIENTO EN EXCEL
Seleccionar análisis de datos en el menú herramientas. En funciones para análisis elija
la opción : Prueba t para medias de dos muestras emparejadas.

23
24
De la tabla concluimos que 2.105 > 1.895 (valor crítico de t una cola), por lo cual
rechazamos Ho.

25

También podría gustarte