Está en la página 1de 18

ALGUNOS PROCEDIMIENTOS DE PRUEBAS DE HIPOTESIS

USO DEL PAQUETE SAS


MUESTRAS GRANDES.
Para todos los casos suponemos que
1 2 n
X , X , , X L
es una muestra aleatoria de una poblacin o distribucin con
media
X

y varianza
2
X
y que
1 2 m
Y , Y , , Y L
es otra muestra aleatoria de otra poblacin con media
Y

y
varianza
2
Y
, ambas muestras independientes entre si.
Pruebas de Hiptesis para Medias.
Sea
1 2 n
X , X , , X L
una muestra aleatoria de una de una poblacin con media
X

y varianza
2
X
. Si el tamao
de la muestra es grande y
2
X
es conocida, el Teorema Central del Lmite garantiza que

( )
X
n
X
X
aprox n 0, 1
n
+

.
de esta manera un !ntervalo de con"ianza apro#imado al ( ) 100 1 % para
X

es de la "orma$
2
X
x z
n

t , donde
2 2
P Z z

_
>

,
.
Si
2
X
es desconocida, esta es estimada usando la varianza %uestral$ ( )
2
2
1
1
1
n
X i
i
S x x
n


y un !ntervalo de
Con"ianza apro#imado al ( ) 100 1 & para
X

es de la "orma$
2
X
s
x z
n

t .
Si
0

es un valor particular para


X

, podemos establecer tres 'iptesis alternativas respecto al valor real de

$
0 0 X
H :
vs
0
0
0
a X
a X
a X
H :
H :
H :
<

>
'

. (stadstico de Prueba$
X
C
X
x
Z
s n

.
{ }
{ }
2
R.C.
R.C.
R.C.
C C
C C
C C
Z | Z z
Z | Z z
Z | Z z

<
>

<
' ;

)sando la parte interactiva del S*S se pueden calcular
X
y
2
X
S para ser usados en la in"erencia respecto a la
media de la poblacin. Cabe *notar que la parte interactiva del S*S asume que las poblaciones involucradas SON
NORMALES independiente del tamao de la muestra. Si las poblaciones no son normales, para realizar pruebas de
'iptesis para la %edia con muestras grandes, debe 'acerse manualmente. Similarmente pasa para la di"erencia de
medias de dos poblaciones con muestras grandes.
Ee!p"# $$ Se tom una muestra aleatoria de +,- estudiantes de una universidad a los cuales se les registr$ (strato
Socioeconmico .EST/, 01mero de 'oras dedicadas semanalmente a estudiar .HORAS/, su EDAD, si traba2aba
.TRAB, SI o NO/ y el Promedio obtenido en el semestre anterior .PROM/. )na parte de los datos se muestra a
continuacin. 3bserve que en este caso no se sabe nada acerca de la distribucin de las variables EDAD PROM.
Suponga que se desea probar si la edad promedio real de un estudiante en dic'a comunidad es superior a los +4
aos con base en esta muestra aleatoria.
Las 'iptesis a probar son$
0
24 H :
vs
24
a
H : >
.
Como el tamao de la muestra es grande, el estadstico de prueba ser5$
24
213
C
X
x
Z
s

.
$
data est;
infile " c:\Estadistica I\datos\induc.txt" firstobs=2;
input est horas edad trab$ prom;
run;
)sando la parte interactiva del S*S se obtienen los siguientes resultados$
Analysis Variable EDAD
N Mean Std Dev

213 24.680!12 !.033040

Por notacin$ 24 68 x . ,
5 033
X
s .
, 213 n
6 Parte de la 7ase de 8atos de los +,- estudiantes encuestados9
EST HORAS EDAD TRAB PROM EST HORAS EDAD TRAB PROM EST HORAS EDAD TRAB PROM
1 28 2 !" #.8 2 1$ 2% !" #.& 2 2' 2( )I 2.8
1 22 21 !" #.$ 2 # 21 !" #.( 2 1% 2' )I #.
1 2$ 2' )I #.8 2 1$ 22 !" #.1 2 18 2$ )I #.2
1 2' 28 )I #.& 2 1 21 !" '. 2 2' 2% )I 2.8
1 21 # !" #.2 2 2$ 2% !" #. 2 18 2' )I #.$
2 12 #$ !" #. 2 1$ 22 !" #. 2 1% ' )I 2.8
2 # 2% !" #.2 2 2 21 !" #. 2 1' 2& )I 2.8
2 ' #2 !" 2.( 2 1% 22 !" #.2 # 2 # !" #.&
2 ( 2% !" #.' 2 8 1( !" 2.( # # #% !" #.#
2 &2 2$ !" #.2 2 ' #& )I 2.( # 2 2& !" #.2
2 12 2$ !" #.1 2 2 2( )I #.# # # 2& !" 2.8
8e esta manera
24 68 24
1 97
5 033 213
C
.
Z .
.


. Para un 0 05 . , tenemos que
0 05
1 645
.
z z .

. La :egin de
:ec'azo es$ { }
R.C. 1 645
C C
Z | Z . > . Como
0 05
1 645
C .
Z z . >
, entonces rec'azamos la 'iptesis 0ula y
concluimos que seg1n la in"ormacin suministrada, la edad promedio real de los estudiantes en dic'a universidad es
superior a los +4 aos. 3bserve que el valor p de la prueba se calcula como$
( ) ( ) 1 97 1 1 97
1 0 9756
0 0244
Vp P Z . P Z .
.
.
>

.
Ee!p"# %. Suponga que se tiene la creencia de que el promedio obtenido por los estudiantes que no traba2an es
superior al promedio de los que si traba2an. Para resolver esta pregunta primero e#pliquemos el procedimiento general
de la prueba para di"erencia de medias con muestras grandes.
Suponga que
1 2 n
X , X , , X L
representa los promedios de quienes no traba2an y que
1 2 m
Y , Y , , Y L
los
promedios de quienes traba2an. *suma que
i X
E X 1
]
,
2
i X
V X 1
]
, 1 2 i , , , n L , y que
j Y
E Y 1
]
,
2
j Y
V Y 1
]
, 1 2 j , , , m L . *mbas muestras son independientes entre si.
Las 'iptesis a probar son$
0
0
X Y
H :
vs
0
0
0
X Y
a X Y
X Y
H :
<

>
'

.
%
8e la teora vista sabemos que un estimador puntual para
X Y

es
X Y
. Como los tamaos de cada muestra
son apreciables, podemos usar el Teorema Central del Lmite para 'allar la distribucin de la di"erencia entre las
medias muestrales$
( )
( )
2 2
0 1
X Y
n
X Y
X Y
aprox n ,
S S
n m
+

+
""""""r
.
(l estadstico de Prueba para esta 'iptesis es$
( )
2 2
X Y
C
X Y
X Y
Z
S S
n m

+
y la regin de rec'azo es de la "orma$ R.C. ;
2
C C
C C
C C
Z | Z z
Z | Z z
Z | Z z

<

>
'

>

dado.
Para el (2emplo en concreto se desea probar$
0
0
X Y
H :
vs
0
a X Y
H : >
.
8e los resultados muestrales se obtuvo$
)sando la notacin esto es equivalente a$ 3 41 x . ,
0 382
x
s .
, 139 n . 3 33 y . ,
0 447
Y
s .
, 74 m .
(l valor del estadstico de prueba es$
2 2
3 41 3 33 0
1 306
0 382 0 447
139 74
C
. .
Z .
. .


+
(l valor P de la prueba ser5$ ( ) ( ) 1 306 1 1 31 1 0 9049 0 0951 Vp P Z . P Z . . . > . Como este valor es
grande no podemos rec'azar la 'iptesis 0ula, es decir, que seg1n la in"ormacin suministrada, no e#iste su"iciente
evidencia para a"irmar que la nota promedio de los que 03 traba2an sea superior a la nota promedio de los que
traba2a$ Pueden asumirse iguales.
Prueba de Hiptesis para Pr#p#r&i#'es
Suponga que ( e ) son variables aleatorias !ndependientes tales que ( )
1
X bin n, p # y ( )
2
Y bin m, p # . Las
pruebas de 'iptesis para proporciones asumen que los tamaos n o m son grandes para utilizar la apro#imacin
dada por el TLC. Sea
0
p
un valor particular de
1
p
. Se desea probar alguna de las siguientes 'iptesis$
0 1 0
H : p p
vs
1 0
1 0
1 0
a
p p
H : p p
p p
<

>
'

.
(l estadstico de prueba y las regiones de rec'azo respectivas son$
*
$
( )
0
0 0
1
C
p p
Z
p p
n

y R.C. ;
2
C C
C C
C C
Z | Z z
Z | Z z
Z | Z z

<

>
'

>

dado
Ee!p"# *. )sando la base de datos anterior, suponga que se tiene la creencia de que m5s del +<& de los
estudiantes en dic'a universidad Traba2an. =(s cierta dic'a a"irmacin>
Sea ?$ 01mero de (studiantes en la muestra de +,- que traba2an. (ntonces ( ) X bin n, p # , con p desconocida.
Las 'iptesis a probar son$
0
0 2 H : p .
vs
0 2
a
H : p . >
. @eamos como probar esta 'iptesis usando la parte
interactiva del S*S. !ngresamos al mdulo *nalyst
Cargamos el arc'ivo de datos que se encuentra en la librera A3:B y cuyo nombre es (ST.
(n el men1 seleccionamos Statisti&s + H,ptesis Test y se obtiene el siguiente men1$
-
Las pruebas de 'iptesis para medias y di"erencia de medias aqu relacionadas asumen que las respectivas
poblaciones son 0ormales.
C La primera es una prueba de 'iptesis para la media de una poblacin 0ormal con varianza conocida
C La segunda es una prueba de 'iptesis para la media de una poblacin 0ormal con varianza desconocida
C La tercera es prueba de 'iptesis para una proporcin poblacional. Se asume un tamao de muestra grande
C La cuarta es prueba de 'iptesis para la varianza de una poblacin 0ormal
C La quinta prueba de 'iptesis para di"erencia de medias de dos poblaciones 0ormales con varianzas
desconocidas. *qu se relacionan dos casos$ @arianzas !guales o @arianzas desiguales
C La se#ta es una prueba de medias para datos Pareados
C La sDptima es una prueba de 'iptesis para la di"erencia entre dos proporciones de dos poblaciones
di"erentes. Se asumen tamaos de muestra grandes
C La 1ltima es una prueba de 'iptesis para igualdad entre varianzas de dos poblaciones normales.
:etomando el e2emplo -, escogemos la opcin -$ Prueba para una proporcin$ *parece un recuadro donde se puede
seleccionar el tipo de 'iptesis alterna. Seleccionamos la variable TRAB. (l aspecto que nos interesa medir es los que
traba2an. Seleccionamos la opcin "e.e" #/ i'terest y 'acemos clicE en S!. (l valor de
0
p
y la alternativa se colocan
en H,p#t0eses Nu"a y A"ter'ate respectivamente$
(n la opcin I'ter.a"s puede pedirle al programa que calcule un !ntervalo de Con"ianza al nivel pre"erido para p.
Podemos calcular un !ntervalo de Con"ianza al FG& para p.
1
Los resultados arro2ados por el S*S son$
*s, tanto el valor P .in"erior a <.<<<,/ como el intervalo de con"ianza ( ) 0 283 0 411 . , . , permiten concluir que la
proporcin de estudiantes que traba2an en dic'a universidad es superior al +<&.
Ee!p"# -. )sando la base de datos anterior. (l pro"esor de (stadstica a"irma que para los estudiantes mayores de
++ aos, la proporcin de estudiantes que no traba2an es di"erente a la proporcin de estudiantes que traba2an. =(s
cierta dic'a a"irmacin>
Sea ($ 01mero de estudiantes que 0o traba2an en la muestra y sea )$ 01mero de estudiantes que traba2an en la
muestra. Suponga que ( )
1
X bin n, p # y ( )
2
Y bin m, p # , donde
1
p
y
2
p
, son las proporciones de estudiantes
en la universidad mayores de ++ aos que 0o traba2an y Traba2an respectivamente, ' y ! son los tamaos de
muestra respectivos. ( e ) son variables aleatorias (stadsticamente !ndependientes.
Las 'iptesis que se desea contrastar son$
0 1 2
0 H : p p
vs
1 2
0
a
H : p p
. (l estadstico de Prueba en este
caso es$
2
$ $
( ) ( )
( )
1 2
1 1 2 2
0
0 1
1 1
C
n , m
p p
Z aprox n ,
p p p p
n m
+


+
""""""r
Como
1
p
y
2
p
son desconocidos, no podemos evaluar directamente este estadstico de prueba. 8os alternativas
pueden ser propuestas para resolver este problema.
$. Cambiar
1
p
y
2
p
por sus estimadores de m5#ima verosimilitud$
$
1
x
p
n
y
$
2
y
p
m
. *s el estadstico de
prueba ser5$
$ $
$ $
( )
$ $
( )
( )
1 2
1 1 2 2
0
0 1
1 1
C
n , m
p p
Z aprox n ,
p p p p
n m
+


+
""""""r
%. 7a2o la 'iptesis nula sabemos que
1
p
y
2
p
son iguales. *l reemplazar a
1
p
y
2
p
por el valor com1n p, el
estadstico de prueba ser5$
$ $
( )
( )
1 2
0
0 1
1 1
1
C
n , m
p p
Z aprox n ,
p p
n m
+

1
+
1
]
""""""r
.
Como p tambiDn es desconocido puede ser estimado por usando un promedio ponderado de
$
1
p y
$
2
p $
$ $ $
1 1
n m x y
p p p
n m n m n m
+
+
+ + +
. *s, el estadstico de Prueba ser5$
$ $
$ $
( )
( )
1 2
0
0 1
1 1
1
C
n , m
p p
Z aprox n ,
p p
n m
+

1
+
1
]
""""""r
.
Para aplicar el procedimiento en la parte interactiva del S*S primero debemos crear una variable categrica que
indique si el estudiante es mayor o menor de ++ aos. (n el Paso 8*T* creamos la variable %*3:$
data est;
infile " c:\rana\estadistica I\datos\induc.txt" firstobs=2;
input est horas edad trab$ prom;
if edad*22 then mayor=")I"; else mayor="!"";
run;
(2ecutamos el programa y volvemos a la parte interactiva.
3
(n el men1 de pruebas de Hiptesis seleccionamos la opcin TIo Smaples Test "or Proportions.
Los estudiantes que nos interesan son los mayores de ++ aos. (l en cuadro de di5logo que aparece la opcin
Gr#ups are I' aparece por de"ecto$ O'e .ariab"e. (n el cuadro Depe'de't seleccionamos la variable MA)OR, y el
recuadro Gr#up seleccionamos la variable TRAB. (l nivel de interDs para la variable %*3: es los que S! son
mayores de ++ aos. Por 1ltimo seleccionamos la 'iptesis nula y la alterna respectivas. La opcin intervals permite
'allar el respectivo intervalo de Con"ianza para
1 2
p p
.
4
Los resultados del procedimiento son$
Tanto el @alor P de la Prueba como el !ntervalo de Con"ianza para
1 2
p p
indica que las proporciones son
di"erentes. %5s a1n, que para los estudiantes mayores de ++ aos es mayor la proporcin de los que traba2an que la
proporcin de los que no traba2an. .Hay m5s estudiantes que traba2an que los que no traba2an mayores de ++ aos/.
MUESTRAS PEQUE5AS 6P#b"a&i#'es N#r!a"es7.
Para realizar pruebas de 'iptesis acerca de la media o de la di"erencia entre medias cuando los tamaos de las
muestras son pequeos, es necesario el supuesto de normalidad en las muestras. Supongamos que
1 2 n
X , X , , X L
es una muestra aleatoria de una poblacin normal con media
X

y varianza
2
X
y que
1 2 m
Y , Y , , Y L
es otra muestra aleatoria de otra poblacin normal con media
Y

y varianza
2
Y
, ambas muestras
independientes entre si.
8e la teora de distribuciones muestrales sabemos que si
2
X
es conocida entonces ( ) 0 1
X
X
X
~ n ,
n

.
Si
2
X
es desconocida, entonces ( ) 1
X
X
X
~ t n
s n

.
Sea
0

un valor particular para


X

. Tres 'iptesis puedes ser planteadas respecto a


X

$
0 0 X
H :
vs
0
0
0
a X
a X
a X
H :
H :
H :
<

>
'

.
8
Si
2
X
es conocida entonces, el estadstico de prueba y la :egin Crtica para un valor dado de

son$
( ) 0 1
X
C
X
X
Z ~ n ,
n

y R.C. ;
2
C C
C C
C C
Z | Z z
Z | Z z
Z | Z z

<

>
'

>

.
Si
2
X
es desconocida entonces, el estadstico de prueba y la :egin Crtica para un valor dado de

son$
( ) 1
X
C
X
X
T ~ t n
s n


y R.C. ;
( )
( )
( )
2
1
1
1
C C
C C
C C
T | T t n
T | T t n
T | T t n

<

>
'

>

, donde ( ) ( ) ( )
1 1 P t n t n

> .
Ee!p"# 1. Se tiene in"ormacin acerca del consumo de gasolina de +G automviles ."uente, :evista %otor Trend,
,FJG/ donde$ )$ %illas por galn, ($$ 8esplazamiento .
3
pl /, (%$ Caballos de "uerza .pieClibra/, (*$ Torque .pieC
libra/, (-$ :azn de compresin, (1$ :elacin de puente trasero, (2$ Carburador .n1mero de gargantas/, (3$ 01mero
de velocidades de transmisin, (4$ Longitud total .pulgadas/, (8$ *nc'o .pulgadas/, ($9$ Peso .libras/, TIPO$ Tipo de
transmisin .*$ *utom5tica, %$ %anual/
Los datos registrados son$
Automovil Y X1 X2 X3 X4 X5 X6 X X! X" X1# T$PO
+pollo 18.( #$ 1%$ 2% 8.:1 2.$%:1 ' # 2.# %(.( #(1 +
!o,a 2. 2$ 1$ 18$ 8.2$:1 2.&#:1 1 # 1(%.& &2.2 #$1 +
-o.rch 18.2$ #$1 1'# 2$$ 8.:1 #.:1 2 # 1((.( &'. #8( +
.uster 2.& 22$ ($ 1& 8.':1 2.&%:1 1 # 1('.1 &1.8 ##%$ -
/enson01on,. 11.2 '' 21$ ## 8.2:1 2.88:1 ' # 18'.$ %( '21$ +
)23ha42 22.12 2#1 11 1&$ 8.:1 2.$%:1 2 # 1&(.# %$.' #2 +
)cirocco #'.& 8(.& & 81 8.2:1 #.(:1 2 ' 1$$.& %' 1($ -
1orolla0)56$ #.' (%.( &$ 8# (.:1 '.#:1 2 $ 1%$.2 %$ 2#2 -
1amaro 1%.$ #$ 1$$ 2$ 8.$:1 #.8:1 ' # 1($.' &'.' #88$ +
.atsun0721 #%.$ 8$.# 8 8# 8.$:1 #.8(:1 2 ' 1%.% %2.2 2( -
1apri0II 21.$ 1&1 1( 1'% 8.2:1 #.22:1 2 ' 1&.' %%.( 2%$$ -
8acer 1(.& 2$8 11 1($ 8.:1 #.8:1 1 # 1&1.$ && ##&$ +
9ra.da 1&.8 #2 12( 22 8.:1 #.:1 2 # 1((.( &' #8( +
El0dorado 1'.#( $ 1( #% 8.$:1 2.&#:1 ' # 22'.1 &(.8 $2( +
Imperial 1'.8( '' 21$ ## 8.2:1 2.&1:1 ' # 2#1. &(.& $18$ +
!o,a0:! 1&.8 #$ 1$$ 2$ 8.$:1 #.8:1 ' # 1(%.& &2.2 #(1 +
)tarfire 2#.$' 2#1 11 1&$ 8.:1 2.$%:1 2 # 1&(.# %$.' #$ +
1ordoba 21.'& #% 18 2( 8.':1 2.'$:1 2 # 21'.2 &%.# '2$ +
;rans0+m 1%.$( ' 18$ . &.%:1 #.8:1 ' # 1(% &# #8$ +
1orolla0E6$ #1.( (%.( &$ 8# (.:1 '.#:1 2 $ 1%$.2 %1.8 22&$ -
-ar20I< 1#.2& '% 22# #%% 8.:1 #.:1 ' # 228 &(.8 $'# +
1elica09; 2#.( 1##.% (% 12 8.':1 #.(1:1 2 $ 1&1.$ %#.' 2$#$ -
1har=er0)E 1(.&# #18 1' 2$$ 8.$:1 2.&1:1 2 # 21$.# &%.# '#& +
1ou=ar 1#.( #$1 1'8 2'# 8.:1 #.2$:1 2 # 21$.$ &8.$ '$' +
1or,ette 1%.$ #$ 1%$ 2$$ 8.$:1 2.&#:1 ' # 18$.2 %( #%% +
)e tiene la creencia de >ue el consumo de =asolina ?-illas por 9al@nA es superior a 2$
millasB=al@n. Es cierta esta afirmaci@nC +suma >ue el consumo de =asolina se distribu3e
aproximadamente normal sin importar el tipo de autom@,il.
$9
Suponga que
1 2 25
X , X , , X L
es una muestra aleatoria que representa los consumos de gasolina en millas por
galn para los +G automviles considerados en el estudio. Suponemos que cada
i
X
es una variable aleatoria normal
con media
X

y varianza
2
X
. *s, cada ( )
2
i X X
X n , # 1 2 25 i , , , L . Las 'iptesis a ser probada es$
0
20
X
H :
vs
20
a X
H : >
.
Como
2
X
es desconocida y la muestra proviene de una distribucin normal, entonces el estadstico de prueba y la
respectiva regin crtica para un

dado son$
( )
20
25 1
25
C
X
X
T ~ t
s


y R.C. ; ( ) { }
1
C C
T | T t n

> .
(l valor P de esta prueba se calcula como$ ( ) ( )
24
C
Vp P t T > . (n S*S.
DATA +D;";
I!EI:E "1:\5+!+\E);+.I);I1+ II\)E- 102#\.+;")\eFer16$0-ont05un.txt" EI5);"7)=2;
I!8D; +D;" $ G H1 H2 H# H' $ H$ $ H%6H1 ;I8" $;
R%&;
(l en cuadro de opciones, al igual que el en caso de proporciones, seleccionamos la variable de !nterDs .$ Consumo
de Kasolina/, el valor de la 'iptesis 0ula .
0
20
X
H :
/ y la respectiva alternativa .
20
a X
H : >
/. *dem5s
podemos indicar el c5lculo de un !ntervalo de Con"ianza al FG& para
X

.
(sta opcin del S*S asume que los consumos de Kasolina est5n distribuidos 0ormalmente.
$$
Los resultados obtenidos son$
Como el @alor P es grande, ( ) ( )
24 0 473 0 3202 Vp P t . . > , 0o tenemos su"iciente evidencia para rec'azar Ho,
es decir el consumo promedio de gasolina puede ser in"erior o igual a +< millasLgaln.
$%
Para Di/ere'&ia de Medias.
Si lo que se desea es comparar el comportamiento promedio de una misma caracterstica en dos poblaciones
di"erentes, cuando los tamaos de muestra son pequeos, no podemos usar el Teorema Central del Lmite para
construir un (stadstico de Prueba adecuado.
8e nuevo, supongamos que
1 2 n
X , X , , X L
es una muestra aleatoria de una poblacin normal con media
X

y
varianza
2
X
y que
1 2 m
Y , Y , , Y L
es otra muestra aleatoria de otra poblacin normal con media
Y

y varianza
2
Y
, donde
2
X
y
2
Y
son desconocidas y ambas muestras independientes entre si.
)n estimador insesgado para
X Y

es
X Y
, pero =Cu5l es la distribucin %uestral de
X Y
>
Consideremos dos casos$
Cas# I$
2 2 2
X Y

7a2o el supuesto de 0ormalidad,
( )
( )
2
2
2
1
1
X
X
n S
n

#
y
( )
( )
2
2
2
1
1
Y
Y
m S
m

#
. como ambas variables son
independientes entre si y
2 2 2
X Y
, entonces$
( ) ( )
( )
2 2
2
2 2
1 1
2
X Y
n S m S
n m

+ +

#
. *dem5s$
( ) ( ) ( ) ( )
( )
2 2
0 1
1 1
X y X y
X Y X Y
Z n ,
n m
n m



+
+
#
. (ntonces$
( ) ( )
( ) ( )
( )
( ) ( )
( )
2 2
2
1 1
2
1 1
1 1
2
X y
X y
X Y
p
X Y
X Y
n m
T t n m
n S m S
S
n m
n m

+

+
+
+

+
#
, donde
( ) ( )
2 2
2
1 1
2
X Y
p
n S m S
S
n m
+

+
.
Cas# I$
2 2
X Y
. 7a2o el supuesto de normalidad en las muestras aleatorias se puede demostrar que$
( ) ( )
( )
2 2 aprox
X y
X Y
X Y
T t
n m



+
#
, donde
2
2 2
2 2
2 2
2
1 1
X Y
X X
S S
n m
S S
n m
n m
_
+


,

_ _


, ,
+
+ +
.
La demostracin de este 'ec'o es un poco m5s elaborada y por eso no se presentar5 aqu. Las 'iptesis a probar
son entonces$
Para probar si las varianzas de ambas muestras son iguales o di"erentes, aunque sean desconocidas, podemos usar
un !ntervalo de Con"ianza al ( ) 100 1 % para el cociente de las varianzas poblacionales, es decir para
2
2
X
Y

.
$*
Si dic'o intervalo contiene el n1mero $, podemos a"irmar que posiblemente las varianzas sean iguales. Si no contiene
el n1mero $, podemos asumir que las varianzas son di"erentes. )n !ntervalo de Con"ianza al ( ) 100 1 % para
2
2
X
Y

est5 basado en la distribucin M de Snedecor. Se puede mostrar que ( )


2 2
2 2
1 1
Y X
X Y
S
! n , m
S

#
. *s, un
!ntervalo de Con"ianza al ( ) 100 1 % para
2
2
X
Y

es de la "orma$
( )
( )
2 2
2 2
1
1 1
1 1
X X
Y Y
S S
, ! m , n
S ! n , m S

_



,
, donde ( ) ( ) ( )
1 1 1 1 P ! n , m ! m , n

> .
Los valores para ( ) 1 1 ! m , n

se encuentran tabulados, para valores pequeos de

. )sualmente se toman
valores de

iguales a <.<G, <.<+G, <.<, .que corresponden a !ntervalos de Con"ianza del F<&, FG& y FN&/.
TambiDn se puede realizar una prueba de 'iptesis para igualdad de @arianzas$
2
0 2
1
X
Y
H :

vs
2
0 2
1
X
Y
H :

.
(stadstico de Prueba$ ( )
2
2
1 1
X
C
Y
S
" ! n , m
S
#
. :.C. ; ( ) { }
1 1
C C
" | " ! n , m

> ,

dado.
Si la 'iptesis 0ula es rec'azada, se concluye que las varianzas poblacionales no son iguales. (n caso contrario
podemos asumir que las varianzas poblacionales son iguales.
Las 'iptesis de interDs a ser probadas son$
0 0 X Y
H :
vs
0
0
0
X Y
a X Y
X Y
H :
<

>
'

, donde
0

es un valor particular.
)sualmente
0

se toma como cero y entonces 'ablamos de una prueba de !gualdad de %edias.


Cas# I$
2 2 2
X Y
. (l estadstico de prueba es$
( ) ( )
( ) 2
1 1
X y
C
p
X Y
T t n m
S
n m

+
+
#
.
La regin crtica es similar al caso de una muestra aleatoria$ R.C. ; ( ) { }
2
C C
T | T t n m

> + ,

dado. (l valor P
de esta prueba se calcula como$ ( ) ( )
2
C
Vp P t n m T + > .
Caso !!$
2 2
X Y
. (l estadstico de Prueba es$
( ) ( )
( )
2 2
X y
C
X Y
X Y
T t
S S
n m


+
#
.
$-
La regin crtica es similar al caso anterior$ R.C. ; ( ) { }
C C
T | T t

> ,

dado. (l valor P de esta prueba se calcula


como$ ( ) ( )
2
C
Vp P t n m T + > .
Ee!p"# 2. Suponga que se cree que los automviles con transmisin %ec5nica consumen en promedio m5s gasolina
que los automviles con transmisin *utom5tica. )sando la base de datos anterior, =es cierta esta a"irmacin>
)sando la parte interactiva del S*S podemos obtener unas estadsticas descriptivas b5sicas respecto al Consumo de
Kasolina en autos con ambos tipos de transmisiones$
Tenemos ,N automviles con transmisin autom5tica y J con transmisin mec5nica. 8e nuevo, supongamos que
1 2 7
X , X , , X L
es una muestra aleatoria que representa los consumos de gasolina de los autos con transmisin
mec5nica, asumamos que estos consumos se distribuyen normalmente con media
X

y varianza
2
X
y que
1 2 18
Y , Y , , Y L
es otra muestra aleatoria que representa los consumos de gasolina de los autos con transmisin
autom5tica, asumamos que estos consumos se distribuyen normalmente con media
Y

y varianza
2
Y
, donde
2
X

y
2
Y
son desconocidas y ambas muestras independientes entre si.
Las 'iptesis a probar son$
0
0
X Y
H :
vs
0
a X Y
H : >
. Primero calculamos un !ntervalo de
Con"ianza al FG& para el cociente de las varianzas
2
2
X
Y

. (n S*S elegimos la opcin$ Hiptesis Test + T:# Sa!p"e


Test /#r ;aria'tes.
*parece un recuadro con un men1 de opciones. Seleccionamos grupos en una variable, variable dependiente , grupo
la variable T!P3. La variable T!P3 permite identi"icar la poblacin. (n este caso la Poblacin ,, ser5 los autos con
transmisin *utom5tica y la Poblacin +, ser5 los autos con transmisin mec5nica .esto debido a que el S*S organiza
en orden al"abDtico/. (sto no !mporta lo que interesa es determinar si el !ntervalo de Con"ianza contiene o no el
n1mero uno o el resultado de la Prueba de Hiptesis. Las 'iptesis a probar son$
2
0 2
1
X
Y
H :

vs
2
0 2
1
X
Y
H :

.
Seleccionamos la opcin I'ter.a"s, escogemos un nivel de con"ianza del FG& y la opcin I'ter.a". Los resultados
obtenidos son$
$1
3bserve que la Hiptesis 0ula es rec'azada, pues el valor P es pequeo. *l mismo tiempo el !ntervalo de Con"ianza
para
2
2
Y
X

03 contiene el n1mero uno. *mbos resultados permiten concluir que las varianzas poblacionales 0o son
!guales. *s, para probar la 'iptesis inicial acerca del consumo de gasolina, debemos asumir que
2 2
X Y
.
(l estadstico de Prueba es$
( ) ( )
( )
2 2 2 2
28 42 17 57 0
4 17
6 568 3 273
7 18
X y
C
X Y
X Y
. .
T .
S S . .
n m



+
+
$2
(n S*S seleccionamos las opciones$ H,ptesis Test + T:#<Sa!p"e t<test /#r Mea's.
(n el recuadro que aparece seleccionamos la variable dependiente , el grupo la variable T!P3, la 'iptesis 0ula
0
0
, la 'iptesis alternativa es Mea' $ + Mea' % = 9, pues los grupos a comparar aparecen primero *utom5tica y
Luego %anual, al revDs de lo planteado en la Hiptesis alterna inicial$
0
a X Y
H : >
Los resultados obtenidos muestran las 'iptesis tanto para varianzas iguales como para varianzas di"erentes$
$3
3bserve que el valor del estadstico de Prueba para @arianzas di"erentes es negativo, esto es porque para el S*S la
poblacin , son los consumos de los autos con transmisin *utom5tica y la Poblacin + los autos con transmisin
%ec5nica.
La conclusin de la prueba, usando el !ntervalo de Con"ianza o el @alor P, permite a"irmar que el consumo de gasolina
para los autos con transmisin %ec5nica es S)P(:!3: al consumo de gasolina para autos con transmisin
*utom5tica.
(l siguiente gr5"ico nos muestra evidencia inicial de que esta a"irmacin es cierta.

$4

También podría gustarte