Está en la página 1de 37

PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept.

2007

PRUEBAS DE HIPTESIS
DE DOS POBLACIONES

P. Reyes
Septiembre 2007

1
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

CONTENIDO

1. Experimentos de comparaciones simples

2. Frmulas para calcular los estadsticos de prueba

3. Ejemplos de pruebas de hiptesis de dos poblaciones

4. Ejercicios adicionales

2
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

Pruebas de hiptesis de dos poblaciones

E n esta seccin se analizan ciertos experimentos que se usan para


comparar condiciones (a menudo llamadas
menudo, se denominan experimentos de comparacin simples.
tratamientos). A

Ejemplo 2.1: La resistencia adhesiva a la tensin del cemento es una


caracterstica importante del producto. Se desea probar la resistencia de
una frmula modificada, a la que se han agregado emulsiones de
polmeros de ltex durante el mezclado, contra la resistencia de la
argamasa hecha con la frmula no modificada. Se hacen 10
observaciones de la resistencia de la frmula modificada y otras 10 de la
frmula no modificada. Los datos aparecen en la Tabla 1.

Tabla 1

Cemento Cement
j o
modificad original
o
J Y1j Y2j
1 16.85 17.50
2 16.40 17.63
3 17.21 18.25
4 16.35 18.00
5 16.52 17.86
6 17.04 17.75
7 16.96 18.22
8 17.15 17.90
9 16.59 17.96
1 16.57 18.15
0

Las dos frmulas pueden considerarse como dos tratamientos, o dos


niveles de las formulaciones de factor.

3
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

A primera vista, estos datos dan la impresin de que la resistencia del


cemento original es mayor que la del modificado, se refuerza al
comparar los valores medios de la resistencia a la tensin, es decir, Y1

16.76 kgf/cm2 del cemento modificado contra Y2 17.92 kgf/cm2 del


cemento original.

Una tcnica de inferencia estadstica llamada prueba de hiptesis


(algunos prefieren denominarla pruebas de significacin), puede servir
para ayudar al experimentador al comparar estas dos frmulas.

Inferencias sobre la diferencia de medias, diseos aleatorizados

A hora se analizan los datos de este experimento de comparacin


simple, usando procedimientos de prueba de hiptesis y de
intervalos de confianza, para comparar las medias de los dos
tratamientos.

Prueba de Hiptesis

Una hiptesis estadstica es una afirmacin acerca de los parmetros de


una poblacin. Por ejemplo, en el problema del cemento puede pensarse
que el nivel medio de la resistencia a la tensin de ambas formulas es
similar. Esto lo podemos expresar, formalmente, de la siguiente manera:

H0 : 1 2
H1 : 1 2

En donde 1 es el valor medio de la resistencia a la tensin del cemento


modificado, mientras que 2 es el valor medio de la resistencia a la
tensin del cemento original. La afirmacin H0 se conoce como hiptesis

4
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

nula, mientras que H1 se conoce como hiptesis alterna. La hiptesis


alterna propuesta en este ejemplo es una hiptesis alterna bilateral, ya
que puede ser verdadera s 1 < 2 o bien s 1, > 2.

Para probar una hiptesis hay que disear un procedimiento para tomar
una muestra aleatoria y calcular un estadstico de prueba apropiada con
objeto de rechazar o no la hiptesis nula H0. Parte de este
procedimiento consiste en especificar el conjunto de valores del
estadstico de prueba que conduzcan al rechazo de H0. Este conjunto de
valores se denomina regin crtica o regin de rechazo de la prueba.

Al efectuar pruebas de hiptesis pueden cometerse dos tipos de error.


Ocurre un error de tipo I cuando la hiptesis nula es rechazada siendo
verdadera. Si la hiptesis nula no es rechazada cuando es falsa se
comete un error de tipo II. Las probabilidades de cometer estos errores
reciben un smbolo especial.

= P(error tipo I) = P(rechazar H0H0 es verdadera)

= P(error tipo II) = P(no rechazar H0H0 es falsa)

En ocasiones, es ms conveniente trabajar con la potencia de la prueba,


donde Potencia = 1 - P(rechazar H0 H0 es falsa)

El procedimiento general de la prueba de hiptesis consiste en


especificar un valor para , la probabilidad de error tipo I, llamado a
menudo, nivel de significacin de la prueba, para despus disear un
procedimiento que asegure un valor pequeo para la probabilidad de
error tipo II.

5
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

Supongamos que puede aceptarse que poseen el mismo valor las


variancias en ambas frmulas de cemento. Una estadstica de prueba
apropiada para usarse en la comparacin del nivel medio de los dos
tratamientos en un diseo completamente aleatorizado es:

Y1 Y 2
to
1 1
Sp
n1 n2

Donde Y1 y Y 2 son las medias mustrales, n1 y n2 el tamao de las


muestras, Sp2 es una estimacin de la variancia comn 12 = 22 = 2
calculado mediante:

Sp 2
n1 1 S12 n2 1 S22
n1 n2 2

S12 y S22 son las dos variancias mustrales individuales. Hay que
comparar t0 con respecto a la distribucin t con n1 + n 2 - 2 grados de
libertad, para decidir si se rechaza H0: 1 = 2. Se debe rechazar H0 y
concluir que el nivel medio de la resistencia a la tensin para las dos
frmulas de mortero de cemento Prtland difieren si to > to/2, n1 + n2 2,
donde to/2, n1 + n2 2 es el punto porcentual /2 superior de la distribucin t
con n1 + n2 -2 grados de libertad.

Este procedimiento se justifica de la siguiente manera: Si se realiza el


muestreo de dos poblaciones normales independientes, la distribucin
de Y1 Y 2 es N{1 - 2, 2(1/n1+ 1/n2)}.

En este caso, si 2 es conocida, y s, adems, H0: 1 = 2 resulta


verdadera, la distribucin de:
Y1 Y 2
Zo
1 1

n1 n2

6
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

Ser NID(0,1 ). Sin embargo, al reemplazar por Sp en la Ecuacin


anterior se cambia la distribucin Zo de la normal estndar a t con n 1 +
n2 -2 grados de libertad. Ahora bien, si H0 es verdadera, t0 en la
Ecuacin de la prueba de to tiene una distribucin tn 1 + n2 -2 y, en
consecuencia, se espera que el 100(1 -) por ciento de los valores de t 0
se encuentren entre t/2, n1 + n2- 2 y t/2, n1 + n2- 2 . Una muestra que
produzca un valor de to fuera de estos lmites es inusual si la hiptesis
nula es verdadera, y constituye una evidencia de que Ho debe ser
rechazada. Ntese que es la probabilidad del error tipo I para la
prueba.

En algunos problemas el experimentador puede estar interesado en


rechazar Ho slo si una media es mayor que la otra. En este caso se
especifica la hiptesis alterna unilateral Ho: 1 > 2 y se rechaza Ho slo
s to > t, n1 + n2- 2. Si se desea rechazar Ho cuando 1 es menor que 2
solo si menor que 1, la hiptesis alterna ser H 1: 1 < 2 y el
experimentador debe rechazar s H s to < -t,n1 + n2 -2.

7
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

Del ejemplo, con los datos de la tabla 2.1, se tiene:

1 16.85 17.50
2 16.40 17.63
3 17.21 18.25
4 16.35 18.00
5 16.52 17.86
6 17.04 17.75
7 16.96 18.22
8 17.15 17.90
9 16.59 17.96
10 16.57 18.15
Media 16.764 17.922
D.E. 0.316 0.248
Var. 0.100 0.061

Cemento modificado:
Y1 16.76kfg/c m 2
S1 2 0.100
S1 0.316
n 10

Cemento original::
Y 2 17.92kfg / cm 2
S12 0.061
S1 0.247
n 10

Sp 2
n1 1 S12 n2 1 S22
n1 n2 2
9(0.100) 9(0.061)
0.081
10 10 2
Sp 0.284

8
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

Ntese que no es razonable concluir que las variancias poblacionales


son iguales por el hecho de que las variancias mustrales sean
similares. La estadstica de prueba es:

Y1 Y 2
to
1 1
Sp
n1 n 2
16.76 17.92
9.13
0.284 1 10 1 10

Ahora bien, el punto porcentual superior de 2.5 de la distribucin t con


n1 + n2 2 = 10 + 10 2 = 18 grados de libertad, es t. 025,18 = 2.101.
Como to= 9.13 > t025,18 = 2.101, debe rechazarse Ho y concluir que
existe diferencia en el nivel medio de la resistencia a la tensin de las
dos clases de mortero.

9
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

2. Frmulas para calcular los estadsticos utilizados en


las pruebas de Hiptesis de 2 poblaciones.

Frmulas para Intervalos de confianza para parmetros de dos


poblaciones

a) Intervalo de confianza para la diferencia entre dos medias


poblacionales (1-2) con muestras grandes (n >= 30 ) y cuando ya se
cuenta con historial, o sea que es conocida:

12 22
IC para ( 1 2 ) ( X 1 X 2 ) Z / 2
n1 n2

Si las poblacionales no se conoce entonces se usan las S de las


muestras en su lugar:

S12 S 22
IC para ( 1 2 ) ( X 1 X 2 ) Z / 2
n1 n2

b) Intervalo de confianza para estimar la diferencia entre dos medias


poblacionales (1-2) con muestras pequeas (n < 30; gl n1 n2 2 ). Con
varianzas iguales (1=2) desconocidas:

S12 (n1 1) S 22 (n2 1) S p2 S p2


S p2 IC para ( 1 2 ) ( X 1 X 2 ) t / 2, gl
n1 n 2 2 n1 n2

c) Intervalo de confianza para estimar la diferencia entre dos medias


poblacionales (1-2) con muestras pequeas (n < 30; grados de
libertad = gl. Con varianzas desiguales (1 2): desconocidas:

( S12 / n1 S 22 / n2 ) 2 S12 S 22
gl IC para ( 1 2 ) ( X 1 X 2 ) t ' / 2 , gl
( S12 / n1 ) 2 /(n1 1) ( S 22 / n2 ) 2 /(n2 1) n1 n2

d) Intervalo de confianza para la diferencia de medias con


observaciones pareadas (gl = n-1):

10
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

d
d i
; Sd
d i
2
nd 2
; IC para d d t / 2, gl
Sd
n n 1 n

e) Intervalo de confianza para estimar la diferencia de proporciones


poblacionales (1- 2):

p1 (1 p1 ) p 2 (1 p 2 )
S p1 p 2 ; IC para ( 1 2 ) ( p1 p 2 ) Z / 2 S p1 p 2
n1 n2

Frmulas para calcular los estadsticos utilizados en las pruebas


de Hiptesis de 2 pob.

f) Estadstico Zc para probar la diferencia entre 2 medias poblacionales


con muestras grandes
(n >= 30):
( X 1 X 2 ) ( 1 2 )
Zc
S12 S 22 Lo normal es que. Ho : 1 2 0 o 1 2

n1 n 2

g) Estadstico Fc para probar la igualdad de varianzas

S12
Fc 2 Seleccionar que S1 sea la mayor.
S2

11
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

h) Estadstico tc para probar la diferencia de medias de 2 poblaciones


con muestras pequeas
(n < 30) y donde se asume que las 1 y 2 son iguales pero
desconocidas:

S12 (n1 1) S 22 (n2 1) ( X X 2 ) ( 1 2 )


S p2 ; tc 1
n1 n2 2 S p2 S p2

n1 n2

i) Estadstico tc para probar la diferencia entre 2 medias poblacionales


con muestras pequeas
(n < 30) y se asume que las 1 y 2 son desiguales y desconocidas:

( X 1 X 2 ) ( 1 2 )
t 'c
S12 S 22

n1 n2

j) Estadstico tc para probar la igualdad de dos medias poblacionales


para observaciones pareadas:


d
d i
; Sd
d i
2
nd 2
; tc
d ( 1 2 )
n n 1 Sd
n

k) Estadsico Zc para probar la diferencia de dos proporciones


poblacionales:

p1 (1 p1 ) p 2 (1 p 2 ) ( p p 2 ) ( 1 2 )
S p1 p 2 ; Zc 1
n1 n2 S p1 p 2

12
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

A continuacin se presentan ejemplos de cada caso:


a) Estadstico Zc para probar la diferencia entre 2
medias poblacionales con muestras grandes
(n >= 30):

( X 1 X 2 ) ( 1 2 )
Zc
S12 S 22 Lo normal es que. Ho : 1 2 0 o 1 2

n1 n 2

Estadstico de tablas Zalfa o Zalfa/2 en Excel


=DISTR.NORM.ESTAND.INV(alfa o alfa/2)

Estadstico de tablas Zalfa o Zalfa/2 en Minitab >Calc >Probability


distributions> Normal:
Inverse Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant =
Alfa o alfa/2

Intervalo de confianza para la diferencia entre dos medias


poblacionales (1-2) con muestras grandes (n >= 30 ) y cuando ya se
cuenta con historial, o sea que es conocida:

12 22
IC para ( 1 2 ) ( X 1 X 2 ) Z / 2
n1 n2

Si las poblacionales no se conoce entonces se usan las S de las


muestras en su lugar:

S12 S 22
IC para ( 1 2 ) ( X 1 X 2 ) Z / 2
n1 n2

13
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

El valor p de probabilidad correspondiente al estadstico Zc se


determina como sigue:

P value en Excel =DISTR.NORM.ESTAND(Zc)

P value en Minitab >Calc >Probability distributions> Normal:


Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant = Zc

Prueba Minitab

>Stat >Basic statistics > 2- Sample t

Summarized data
Sample size Mean Standar deviation

First 60 587 145


Second 50 512 125

! Assume equal variances

Options: Confidence level 98%


Test difference 0.0
Alternate Not equal
OK

14
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

Criterios de rechazo de Ho:

Si Zc cae en la zona de rechazo


El valor Cero de la Hiptesis no se encuentra en el Intervalo de confianza
El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2
(dos colas).

b) Estadstico Fc para probar la igualdad de varianzas

S12
Fc 2 Seleccionar que S1 sea la mayor.
S2

Estadstico de tablas Falfa/2 en Excel = DISTR.F.INV(Alfa/2, gl. n1-1,


gl. n2-1)

El valor p de probabilidad correspondiente a Fc en Minitab se determina


como sigue:

P value en Excel =DISTR.F(Fc, gl. n1-1, gl. n2-2)

P value en Minitab >Calc >Probability distributions> F:


Cummulative prob; Numerator degrees of freedom = n1- 1;
denominator degrees of freedom = n2-1; Input constant = Fc

15
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

Prueba Minitab

>Stat >Basic statistics > 2- Variances

Summarized data
Sample size Variance
First 60 21025
Second 50 15625

Number of trial 500 Number of events 225

Options: Confidence level 98%

OK

Resultados

Test for Equal Variances


98% Bonferroni confidence intervals for standard deviations

Sample N Lower StDev Upper


1 60 116.937 145 188.881
2 50 98.928 125 167.622

F-Test (normal distribution)


Test statistic = 1.35, p-value = 0.287

16
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

Criterios de rechazo de Ho:

Si Fc cae en la zona de rechazo


El valor Cero de la Hiptesis no se encuentra en el Intervalo de confianza
El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2
(dos colas).

c) Estadstico tc para probar la diferencia de medias de


2 poblaciones con muestras pequeas (n < 30) y donde
se asume que las 1 y 2 son iguales pero
desconocidas:

S12 (n1 1) S 22 (n2 1) ( X X 2 ) ( 1 2 )


S
2
p ; tc 1
n1 n2 2 S p2 S p2

n1 n2

Estadstico de tablas Talfa o Talfa/2 en Excel =DISTR.T.INV(2*alfa o


alfa, grados de libertad n1+n2-2)

Estadstico de tablas Talfa o Talfa/2 en Minitab >Calc >Probability


distributions> :
Inverse Cummulative prob; Degrees of freedom = n1+n2-2; Input
constant = Alfa o alfa/2

Intervalo de confianza para estimar la diferencia entre dos medias


poblacionales (1-2) con muestras pequeas (n < 30; gl n1 n2 2 ). Con
varianzas iguales (1=2) desconocidas:

17
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

S12 (n1 1) S 22 (n 2 1)
S
2
p
n1 n2 2
S p2 S p2
IC para ( 1 2 ) ( X 1 X 2 ) t / 2, gl
n1 n2

El valor p de probabilidad correspondiente al estadstico Tc se


determina como sigue:

P value en Excel =DISTR.T(Tc, grados de libertad = n1 + n2 - 2, 1 o 2


colas)

P value en Minitab >Calc >Probability distributions> T:


Cummulative prob; Degrees of freedom = n1 + n2 - 2; Input
constant = Tc

Criterios de rechazo de Ho:

Si Tc cae en la zona de rechazo


El valor Cero de la Hiptesis no se encuentra en el Intervalo de confianza
El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2
(dos colas).

18
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

Prueba Minitab

>Stat >Basic statistics > 2- Sample t

Summarized data
Sample size Mean Standar deviation

First 60 587 145


Second 50 512 125

! Assume equal variances

Options: Confidence level 98%


Test difference 0.0
Alternate Not equal

OK

Resultados

Two-Sample T-Test and CI

SE
Sample N Mean StDev Mean
1 60 587 145 19
2 50 512 125 18

Difference = mu (1) - mu (2)


Estimate for difference: 75.0000

19
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

98% CI for difference: (13.3739, 136.6261)

Si en el IC no se encuentra el 0 se rechaza la Hiptesis nula.

T-Test of difference = 0 (vs not =): T-Value = 2.87 P-Value = 0.005 DF =


108
Both use Pooled StDev = 136.2901

d) Estadstico tc para probar la diferencia entre 2


medias poblacionales con muestras pequeas (n < 30)
y se asume que las 1 y 2 son desiguales y
desconocidas:

( X 1 X 2 ) ( 1 2 )
t 'c
S12 S 22

n1 n2

Estadstico de tablas Talfa o Talfa/2 en Excel =DISTR.T.INV(2*alfa o


alfa, grados de libertad calculados)

Estadstico de tablas Talfa o Talfa/2 en Minitab >Calc >Probability


distributions> :
Inverse Cummulative prob; Degrees of freedom =calculados; Input
constant = Alfa o alfa/2
( S12 / n1 S 22 / n2 ) 2
gl
( S12 / n1 ) 2 /( n1 1) ( S 22 / n2 ) 2 /(n2 1)

20
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

Intervalo de confianza para estimar la diferencia entre dos medias


poblacionales (1-2) con muestras pequeas (n < 30; grados de
libertad = gl. Con varianzas desiguales (1 2): desconocidas:

S12 S 22
IC para ( 1 2 ) ( X 1 X 2 ) t ' / 2, gl
n1 n2

El valor p de probabilidad correspondiente al estadstico Tc se


determina como sigue:

P value en Excel =DISTR.T(Tc, grados de libertad =calculados, 1 o 2


colas)

P value en Minitab >Calc >Probability distributions> T:


Cummulative prob; Degrees of freedom = calculados; Input constant =
Tc

Criterios de rechazo de Ho:

Si Tc cae en la zona de rechazo


El valor Cero de la Hiptesis no se encuentra en el Intervalo de confianza
El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2
(dos colas).

e) Estadstico tc para probar la igualdad de dos medias


poblacionales para observaciones pareadas:


d
d i
; Sd
d i
2
nd 2
; tc
d ( 1 2 )
n n 1 Sd
n

21
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

Estadstico de tablas Talfa o Talfa/2 en Excel =DISTR.T.INV(2*alfa o


alfa, grados de libertad = n-1)

Estadstico de tablas Talfa o Talfa/2 en Minitab >Calc >Probability


distributions> :
Inverse Cummulative prob; Degrees of freedom = n 1; Input constant
= Alfa o alfa/2

Intervalo de confianza para la diferencia de medias con


observaciones pareadas (gl = n-1):

d
d i
; Sd
d i
2
nd 2
; IC para d d t / 2, gl
Sd
n n 1 n

El valor p de probabilidad correspondiente al estadstico Tc se


determina como sigue:

P value en Excel =DISTR.T(Tc, grados de libertad = n 1, 2 colas)

P value en Minitab >Calc >Probability distributions> T:


Cummulative prob; Degrees of freedom = n - 1; Input constant =
Tc

22
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

Prueba en Minitab

>Stat >Basic statistics > Paired t

Summarized data (differences)


Sample size 81
Mean 36.5
Standar deviation 29.1

Options: Confidence level 99%


Test difference 0.0
Alternate Not equal

OK

Resultados

Paired T-Test and CI

N Mean StDev SE Mean


Difference 81 36.5000 29.1000 3.2333

99% CI for mean difference: (27.9682, 45.0318)


T-Test of mean difference = 0 (vs not = 0): T-Value = 11.29
P-Value = 0.000

Criterios de rechazo de Ho:

23
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

Si Tc cae en la zona de rechazo


El valor Cero de la Hiptesis no se encuentra en el Intervalo de confianza
El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2
(dos colas).

f) Estadsico Zc para probar la diferencia de dos


proporciones poblacionales:

p1 (1 p1 ) p 2 (1 p 2 ) ( p p 2 ) ( 1 2 )
S p1 p 2 ; Zc 1
n1 n2 S p1 p 2

Estadstico de tablas Zalfa o Zalfa/2 en Excel


=DISTR.NORM.ESTAND.INV(alfa o alfa/2)

Estadstico de tablas Zalfa o Zalfa/2 en Minitab >Calc >Probability


distributions> Normal:
Inverse Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant =
Alfa o alfa/2

Intervalo de confianza para estimar la diferencia de proporciones


poblacionales (1- 2):
p1 (1 p1 ) p 2 (1 p 2 )
S p1 p 2 ; IC para ( 1 2 ) ( p1 p 2 ) Z / 2 S p1 p 2
n1 n2

24
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

El valor p de probabilidad correspondiente al estadstico Zc se


determina como sigue:

P value en Excel =DISTR.NORM.ESTAND(Zc)

P value en Minitab >Calc >Probability distributions> Normal:


Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant = Zc

Prueba Minitab

>Stat >Basic statistics > 2- Proportion

Summarized data
Trials Events
First 120 83
Second 150 109

Confidence level 95% Test differenca 0.0


Alternative Not equal

! Use pooled estimate of p for test

OK

Resultados

Test and CI for Two Proportions

Sample X N Sample p

25
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

1 83 120 0.691667
2 109 150 0.726667

Difference = p (1) - p (2)


Estimate for difference: -0.035
95% CI for difference: (-0.144150, 0.0741499)
Test for difference = 0 (vs not = 0): Z = -0.63 P-Value =
0.528

Si Zc cae en la zona de rechazo


El valor Cero de la Hiptesis no se encuentra en el Intervalo de confianza
El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2
(dos colas).

26
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

3. Ejemplos de pruebas de hiptesis de dos


poblaciones

Prueba Z de 2 colas
Problema 1
Se toman muestras de tamao n2=50 y n1=60, revelan medias y
desviaciones estndar X2=512, s2 =125, X1=587, s1=145
respectivamente. A un nivel del 2% pruebe la hiptesis de que las
medias de ambas poblaciones son iguales.

Solucin

a) Prueba de igualdad de varianzas

Solucin
1) Ho: 12 = 22
Ho: 12 22

2) Fc = 145*145 / 125*125 = 1.3456

3) F0.02/2,59,49 = distr.f.inv(0.01, 59, 49) = 1.92

4) Dado que Fc= 1.34 es menor que Ft= 1.92 la Ho no se rechaza a


un nivel de alfa del 2%. Indicando que las varianzas son
iguales:

5) El valor P correspondiente a Fc es: =distr.f(1.34, 59,49) = 0.1467

27
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

Prueba Minitab

>Stat >Basic statistics > 2- Variances


Summarized data
Sample size Variance
First 60 21025
Second 50 15625

Number of trial 500 Number of events 225


Options: Confidence level 98%
OK

RESULTADOS Y CONCLUSIONES

Las varianzas son iguales

b) Prueba de la igualdad de medias

1) Ho: 1 = 2
Ho: 1 2

2) S= (125)2 / 50 + (145) 2 / 60 = 312.5 + 350.42 = 25.75


Zc= (512 -587) 0 / 25.75 = -75 / 25.75 = -2.91

3) = 2%
0.02/2 = 0.01
Z de tablas para 0.01 = -2.32

4) Dado que Zc= -2.91 es menor a Zt=-2.32 la Ho se rechaza a un


nivel alfa del 2%.

28
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

Las medias de las poblaciones no son iguales

5) Valor P correspondiente a Zc es 0.0018 con =distr.norm.estand(-


2.91)

Prueba Minitab

>Stat >Basic statistics > 2- Sample t


Summarized data
Sample size Mean Standar deviation

First 60 587 145


Second 50 512 125
! Assume equal variances

Options: Confidence level 98%


Test difference 0.0
Alternate Not equal
OK

RESULTADOS Y CONCLUSIONES

Problema 2
Se toman muestras de tamao n2=64 y n1=81, revelan medias y
desviaciones estndar X2=65.2 s2=21.2 X1=58.6, s1=25.3
respectivamente. A un nivel del 5% pruebe la hiptesis de que las
varianzas y despus de que las medias de ambas poblaciones son
iguales.
Solucin

29
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

a) Prueba de igualdad de varianzas

1) Ho: 12 = 22
Ho: 12 22

2) Fc = 25.3*25.3/ 21.2*21.2 = 1.424

3) F0.05/2,80,63 = distr.f.inv(0.025, 80, 63) = 1.61

4) Dado que Fc= 1.424 es menor que Ft= 1.61 la Ho no se rechaza


a un nivel de alfa del 5%. Indicando que las varianzas son
iguales:

El valor P correspondiente a Fc para media cola es: =distr.f(1.424, 80,


63) = 0.072

Prueba con Minitab: RESULTADOS Y CONCLUSIONES

b) Prueba de igualdad de medias


1) Ho: 1 = 2
Ho: 1 2

2) S= (21.2)2 / 64 + (25.3) 2 / 81 = 7.02 + 7.90 = 3.86


Zc= (65.2 -58.6) 0 / 3.86 = 1.71
3) = 5%
0.05/2=0.025

Z de tablas para 0.025 = 1.95

30
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

4) Dado Zc= 1.71 menor a Zt=1.95 la Ho no se rechaza a un nivel de


confianza del 5%.
Indicando que las medias poblacionales no son diferentes

5) Valor P de la prueba para Zc = 1.71 =distr.norm.estand(-1.71) =


0.0436
Este valor es mayor que alfa/ 2 = 0.025 por tanto se rechaza Ho.

Prueba con Minitab: RESULTADOS Y CONCLUSIONES

Problema 3
Determinar a un 90% de nivel de confianza si hay diferencia entre las
varianzas y las medias de los tiempos que se tarda en arreglar una
cocina y una recmara:
A) Prueba de igualdad de dos varianzas
B) Prueba de igualdad de dos medias
Cocina Recamara
25.2 18.0
17.4 22.9 Prueba con Minitab: RESULTADOS Y
22.8 26.4
CONCLUSIONES
21.9 24.8
19.7 26.9
23.0 17.8 Problema 4
19.7 24.6
23.0 21.0 Probar si hay diferencia entre los mtodos actual y
19.7 nuevo para la realizacin de una tarea, a un 95% de
16.9
nivel de confianza:
21.8
23.6
Los datos de los tiempos de respuesta para ambos mtodos se muestran
a continuacin:

Actual Nuevo
300 276
280 222
344 310

31
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

385 338
372 200
360 302
288 317
321 260
376 320
290 312
301 334
283 265

A) Probar la igualdad de las varianzas


B) Probar la igualdad de las medias

Prueba con Minitab: RESULTADOS Y CONCLUSIONES

Prueba Z de dos colas para proporciones

Problema 5
Muestras de tamao n1=120 y n2=150 produjeron proporciones de
p1=0.69 y p2=0.73. Pruebe la igualdad de las proporciones de las
poblaciones a un nivel del 5%.

1) Ho: 1 = 2
Ho: 1 2
2) s= (0.69)(1-0.69) / 120 + (0.73)(1-0.73)/150 = 0.00178 +
0.00131= 0.056
Zc= 0.69 0.73 / 0.056 = -0.714
3) 0.05/2 = 0.025
Z de tablas para 0.025= -1.95
4) Dado que Zc=- 0.714 es mayor que Zt=-1.95 la Ho no se rechaza
a un nivel de confianza del 5%.

32
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

5) El valor P correspondiente a la Zc es 0.2376 con


=distr.norm.estand(Zc = -0.714

Prueba Minitab

>Stat >Basic statistics > 2- Proportion


Summarized data
Trials Events
First 120 83
Second 150 109
Confidence level 95% Test differenca 0.0 Alternative Not equal
! Use pooled estimate of p for test
OK
RESULTADOS Y CONCLUSIONES

Problema 6
Yahoo hizo una encuesta para determinar el porcentaje de personas que
usaban Internet en el trabajo:

En Mxico se encontr que el 40% de los adultos usa Internet de una


muestra de 240. En Monterrey el 32% de los adultos usaba Internet de
una muestra de 250. Es mayor la proporcin que usa Internet en
Mxico que en Monterrey para un 95% de nivel de confianza?

33
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

4. Ejercicios adicionales:

1. Se toman 200 muestras de dos segmentos normales de clientes


identificando su preferencia en los productos de la empresa, los datos
obtenidos son: Media 1 = 6.40, Sigma 1 = 2.19, Media 2 = 6.80, Sigma
2 = 2.42.

Probar a un 95% de nivel de confianza si no hay diferencia en las


medias.

2. Los resultados para dos diferentes equipos se muestran a


continuacin:

A 60.0 56.0 68.8 77.0 74.4 72.0 57.6 64.2 75.2 58.0 60.2 56.6
B 55.2 44.4 62.0 67.6 40.0 60.4 63.4 52.0 64.0 62.4 66.8 53.0

Probar a un 95% de nivel de confianza si:

a) Si no hay diferencia en las varianzas de los segmentos.

b) Si no hay diferencia en las medias de los segmentos.

3. Los tiempos de llamadas a dos servicios de Call centres en minutos


son los siguientes:

A 2.95 3.16 3.12 3.45 3.2 3.22 3.5 3.22 2.98 3.75 3.38 3.45 3.48 3.9
B 3.22 3.3 3.34 3.28 3.29 3.25 3.3 3.27 3.38 3.34 3.35 3.19 3.35 3.05

Probar a un 80% de nivel de confianza si hay diferencia:

34
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

a) Entre las varianzas de los dos Call Centers.

b) Entre las medias de los dos Call Centers.

4. A dos grupos de inspectores se les pidi que indicaran el porcentaje


de rechazo en dos lneas de produccin:

Lnea A: Lotes inspeccionados 50 Lotes rechazados 21


Lnea B: Lotes inspeccionados 65 Lotes rechazados 26

Probar a un Nivel de Confianza del 98% se hay diferencia de calidad en


las dos lneas productivas.

5. Determinar a un nivel de confianza del 90% si hay diferencia entre las


medias de dos poblaciones.

25. 17. 22. 21. 19. 23. 19. 23. 19. 16. 21. 23.
Cocina 2 4 8 9 7 0 7 0 7 9 8 6
18. 22. 26. 24. 26. 17. 24. 21.
Recamara 0 9 4 8 9 8 6 0

6. Se toman muestras aleatorias de 15 mujeres sindicalizadas y 20 no


sindicalizadas con los siguientes: salarios por hora:

18. 14. 16. 20. 16. 16. 19. 16. 18. 19. 17. 17.
22.4 9 16.7 1 2 0 1 3 1 5 5 8 0 14.3 2
Sind
. No sind.
14. 15. 17. 15. 17. 13. 11. 15. 19. 11. 16. 145. 15.
17.6 4 16.6 0 7 0 6 3 2 9 2 9 7 2 3
17.0 15. 14.3 13. 14.

35
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

1 9 5

7. Los tiempos de terminacin del programa y estadsticos del estudio de


prueba del programa se muestran a continuacin:

Tecnologa actual: 300 280 344 385 372 360 288 321
376 290 301 283
Nuevo programa: 276 222 310 338 200 302 317 260
320 312 334 265

8. Los tiempos de terminacin para la tarea con un mtodo mejorado y


actual son, para el mismo empleado:Pareadas

Mtodo 1 6.0 5.0 7.0 6.2 6.0 6.4


Mtodo 2 5.4 5.2 6.5 5.9 6.0 5.8

9. Un comprador califica un producto antes y despus de ver un


comercial: pareadas
Antes 5 4 7 3 5 8 5 6
Despus 6 6 7 4 3 9 7 6

10. A dos grupos de personas se les pidi que indicaran el porcentaje de


recordatorio de dos comerciales:

Comercial Lo vieron Lo recordaron


A 150 63
B 200 60
Probar a un 5% si son iguales los dos grupos

36
PRUEBAS DE HIPTESIS DE DOS POBLACIONES P. Reyes/Sept. 2007

11. Yahoo hizo una encuesta para determinar el porcentaje de personas


que usaban Internet en el trabajo:

En Mxico se encontr que el 40% de los adultos usa Internet de una


muestra de 240.
En Monterrey el 32% de los adultos usaba Internet de una muestra de
250.

Es mayor la proporcin que usa Internet en Mxico que en Monterrey?

12. Los tiempos de respuesta en das de dos procesos de atencin al


cliente se muestran a continuacin:

Proceso 2.9 3.1 3.4 3.2 3.2 2.9 3.7 3.3 3.4 3.4
A 5 3.16 2 5 3.2 2 3.5 2 8 5 8 5 8 3.9
3.3 3.3 3.3 3.2 3.1 3.2 3.3 3.1
3.7 3.26 6 4 3 5 8 3.2 8 5 2

Proceso 3.2 3.3 3.2 3.2 3.2 3.2 3.3 3.3 3.3 3.1 3.3 3.0
B 2 3.3 4 8 9 5 3.3 7 8 4 5 9 5 5
3.3 3.25 3.2 3.1 3.3
6 8 3.3 8 3.3 3.3 3.2 6 3

Probar a un 95% de confianza si hay diferencia entre las varianzas de las


dos muestras.

37

También podría gustarte