Está en la página 1de 26

7.

- PRUEBA DE HIPOTESIS

7.1. INTRODUCCIN
La estadstica inferencial es el proceso de usar la informacin de una
muestra para describir el estado de una poblacin. Sin embargo es
frecuente que usemos la informacin de una muestra para probar un
reclamo o conjetura sobre la poblacin. El reclamo o conjetura se refiere a
una hiptesis. El proceso que corrobora si la informacin de una muestra
sostiene o refuta el reclamo se llama prueba de hiptesis.

7.2. Errores tipo I y tipo II.
A base de la informacin de una muestra nosotros podemos cometer dos tipos de
errores en nuestra decisin.
1. Podemos rechazar un H
0

que es cierto.
2. Podemos aceptar un H
0
que es falso.
El primero se llama error Tipo 1
Error Tipo 1: Cuando rechazamos una Hiptesis Nula que es cierta cometemos
error tipo 1.

Y el segundo error se llama error Tipo 2.
Error Tipo 2: Cuando aceptamos una Hiptesis Nula que es falsa cometemos error
tipo 2.
Para ser muy cuidadosos en no cometer el error tipo 1, debemos especificar la
probabilidad de rechazar H
0
, denotada por . A sta se le llama nivel de significancia.

ivel de Significancia: La probabilidad () ms alta de rechazar H
0
cuando H
0
es
cierto se llama nivel de significancia.
Comentario: Para mantener la probabilidad de cometer el error tipo 1 baja, debemos escoger un
valor pequeo de .
Usando un valor preasignado de se construye una regin de rechazo o regin
crtica en la curva normal estndar o en la curva t que indica si debemos rechazar
H
0
.
Regin Crtica o de Rechazo: Una regin crtica o de rechazo es una parte de la
curva de z o de la curva t donde se rechaza H
0
.
La regin puede ser de una cola o


7.3. Potencia de la prueba
Con dos muestras
Sin importar cmo se calcularon los grados de libertad, podemos ver en la
tabla 2 que la prueba de Hartley, en general, cuando Ho es verdadera no da
buenos resultados cuando los tamaos son muy grandes como 100100, ya
que lo ideal en este caso es que H0 sea aceptada, por lo tanto el porcentaje
de veces que se rechaza la hiptesis nula, siendo esta verdadera, debe ser
bajo. Esta prueba, tomando los grados de libertad mx.(ni) 1, que en
adelante llamaremos h.max, no es buena, al igual que la prueba de
Cochran, cuando los tamaos de las dos muestras son muy diferentes.

En las tablas 3 a 5, las varianzas de las dos muestras son diferentes; se
espera que las pruebas detecten esta diferencia, lo que se ver reflejado en
la potencia, la cual se espera que sea alta. h.max tiene valores grandes de
potencia cuando los tamaos de las muestras son muy diferentes y cuando
son muy grandes, pero ya vimos que tambin tiene estos valores en la tabla
2, por lo tanto esta prueba se afecta por los tamaos de las muestras, al
igual que la de Cochran.
Las pruebas de Layard, de Bartlett y de la teora de la informacin tienen
tamaos cercanos al nivel nominal del 5% cuando la hiptesis nula es
cierta.
Cuando H0 es falsa, las potencias de estas pruebas fueron altas
comparadas con las otras pruebas competidoras, mejorando cuando los
tamaos de las muestras son ms grandes. Las pruebas de Levene y de
Fligner tienen menor potencia que las dems pruebas, excepto cuando la
diferencia en las varianzas es grande y los tamaos de las muestras son
mayores que 50.




Con tres muestras
En la tabla 6 vemos que la prueba h.max tiene valores muy altos de nivel
de significancia cuando uno de los tamaos es 100, pero cuando los
tamaos son iguales tiene valores bajos.
En las tablas 7 a 11, donde las varianzas son diferentes, las pruebas de
Hartley tienen un buen desempeo cuando los tamaos son iguales y
menores que 100; notemos tambin que las pruebas de Layard son buenas
para detectar diferencias pequeas en la varianza de las muestras, aunque
su potencia disminuye cuando los tamaos de las muestras son iguales. La
prueba de Cochran es muy buena para detectar si una varianza es diferente
de las otras, tablas 7 y 8, pero slo cuando los tamaos de las muestras
son iguales. Las pruebas de Bartlett, de teora de la informacin y de Layard
tienen valores de potencia altos, especialmente cuando los tamaos de
todas las muestras son mayores que 30.




Con cuatro muestras
En las tablas 12 a 17 observamos que todas las pruebas tienen buen
desempeo al aumentar el nmero de muestras. Se debe destacar el
desempeo de la prueba de Layard sin modificar. Las pruebas de Levene
tienen mejores resultados comparados con los resultados obtenidos con 2 y
3 muestras.
La prueba h.min no tiene buenos resultados; sus valores de potencia
siempre son bajos, cuando la diferencia en las varianzas es pequea. En
general los resultados de las pruebas se afectan cuando el tamao de las
muestras es muy diferente.


7.4. Formulacin de la hiptesis estadstica
En la prueba de hiptesis se pone a prueba un reclamo hecho sobra la
naturaleza de una poblacin a base de la informacin de una muestra. El
reclamo se llama hiptesis estadstica.
Hiptesis Estadstica: Una hiptesis estadstica es un reclamo hecho
sobre la naturaleza de una poblacin.
Por ejemplo, la premisa formulada por un productor de bateras para autos
de que su batera dura en promedio 48 meses, es una hiptesis estadstica
porque el manufacturero no inspecciona la vida de cada batera que l
produce.
Si surgieran quejas de parte de los clientes, entonces se pone a prueba el
reclamo del manufacturero. La hiptesis estadstica sometida a prueba se
llama la hiptesis nula, y se denota como H
0
.
Hiptesis ula (H
0
): premisa, reclamo, o conjetura que se pronuncia sobre la
naturaleza de una o varias poblaciones.
Por ejemplo, para probar o desaprobar el reclamo pronunciado por el productor de
bateras debemos probar la hiptesis estadstica de que 48. Por lo tanto, la
hiptesis nula es:
H
0
: 48.
Luego se procede a tomar una muestra aleatoria de bateras y medir su vida media.
Si la informacin obtenida de la muestra no apoya el reclamo en la hiptesis nula
(H
0
), entonces otra cosa es cierta. La premisa alterna a la hiptesis nula se llama
hiptesis alterna y se representa por H
1
.
Hiptesis Alterna: Una premisa que es cierta cuando la hiptesis nula es falsa.

Por ejemplo, para el productor de bateras
H
0

: 48 y
H
1
: < 48
Para probar si la hiptesis nula es cierta, se toma una muestra aleatoria y se calcula
la informacin, como el promedio, la proporcin, etc. Esta informacin muestral se
llama estadstica de prueba.

Estadstica de Prueba: Una estadstica de prueba se basa en la informacin de la
muestra como la media o la proporcin


7.5. Prueba de hiptesis para la media

Sea
1 2 n
X , X , , X L una muestra aleatoria de una de una poblacin con
media
X
y varianza
2
X
. Si el tamao de la muestra es grande y
2
X
es
conocida, el Teorema Central del Lmite garantiza que

( )
X
n
X
X
aprox n 0, 1
n
+

. Y de esta manera un Intervalo de confianza


aproximado al ( ) 100 1 % para
X
es de la forma:
2
X
x z
n

, donde
2 2
P Z z

| |
> =
|
\
.
Si
2
X
es desconocida, esta es estimada usando la varianza Muestral:
( )
2
2
1
1
1
n
X i
i
S x x
n
=
=


y un Intervalo de Confianza aproximado al ( ) 100 1
% para
X
es de la forma:
2
X
s
x z
n

.
Si
0
es un valor particular para
X
, podemos establecer tres hiptesis
alternativas respecto al valor real de :
0 0 X
H : = vs
0
0
0
a X
a X
a X
H :
H :
H :
<

>

. Estadstico de Prueba: .
{ }
{ }
2
R.C.
R.C.
R.C.
C C
C C
C C
Z | Z z
Z | Z z
Z | Z z

= <
= >

= <
`
)





7.6. Prueba de hiptesis para la diferencia de media
X
C
X
x
Z
s n

=
Para Diferencia de Medias.

Si lo que se desea es comparar el comportamiento promedio de una misma
caracterstica en dos poblaciones diferentes, cuando los tamaos de
muestra son pequeos, no podemos usar el Teorema Central del Lmite
para construir un Estadstico de Prueba adecuado.

De nuevo, supongamos que
1 2 n
X , X , , X L es una muestra aleatoria de
una poblacin normal con media
X
y varianza y que
1 2 m
Y , Y , , Y L
es otra muestra aleatoria de otra poblacin normal con media
Y
y varianza
2
Y
, donde
2
X
y
2
Y
son desconocidas y ambas muestras
independientes entre si.

Un estimador insesgado para
X Y
es X Y , pero Cul es la
distribucin Muestral de X Y ?
Consideremos dos casos:

Caso I:
2 2 2
X Y
= =

Bajo el supuesto de Normalidad,
( )
( )
2
2
2
1
1
X
X
n S
n

y
( )
( )
2
2
2
1
1
Y
Y
m S
m

. Y como ambas variables son independientes entre si


y
2 2 2
X Y
= = , entonces:
( ) ( )
( )
2 2
2
2 2
1 1
2
X Y
n S m S
n m

+ +

. Adems:
( ) ( ) ( ) ( )
( )
2 2
0 1
1 1
X y X y
X Y X Y
Z n ,
n m
n m

= =

+
+
. Entonces:
2
X


( ) ( )
( ) ( )
( )
( ) ( )
( )
2 2
2
1 1
2
1 1
1 1
2
X y
X y
X Y
p
X Y
X Y
n m
T t n m
n S m S
S
n m
n m

+

= = +
+
+

+
, donde
( ) ( )
2 2
2
1 1
2
X Y
p
n S m S
S
n m
+
=
+
.


Caso I:
2 2
X Y
. Bajo el supuesto de normalidad en las muestras
aleatorias se puede demostrar que:
( ) ( )
( )
2 2 aprox
X y
X Y
X Y
T t
n m

=

+

, donde
2
2 2
2 2
2 2
2
1 1
X Y
X X
S S
n m
S S
n m
n m
| |
+
|
|
\
=
| | | |
| |
| |
\ \
+
+ +
.

La demostracin de este hecho es un poco ms elaborada y por eso no se
presentar aqu. Las hiptesis a probar son entonces:

Para probar si las varianzas de ambas muestras son iguales o diferentes,
aunque sean desconocidas, podemos usar un Intervalo de Confianza al
( ) 100 1 % para el cociente de las varianzas poblacionales, es decir para
2
2
X
Y

.
Si dicho intervalo contiene el nmero 1, podemos afirmar que posiblemente
las varianzas sean iguales. Si no contiene el nmero 1, podemos asumir
que las varianzas son diferentes. Un Intervalo de Confianza al ( ) 100 1 %
para
2
2
X
Y

est basado en la distribucin F de Snedecor. Se puede mostrar


que ( )
2 2
2 2
1 1
Y X
X Y
S
f n , m
S

. As, un Intervalo de Confianza al ( ) 100 1 %


para es de la forma:
( )
( )
2 2
2 2
1
1 1
1 1
X X
Y Y
S S
, f m , n
S f n , m S

| |

|
|

\
, donde
( ) ( ) ( )
1 1 1 1 P f n , m f m , n

> = .

Los valores para ( ) 1 1 f m , n

se encuentran tabulados, para valores


pequeos de . Usualmente se toman valores de iguales a 0.05, 0.025,
0.01 (que corresponden a Intervalos de Confianza del 90%, 95% y 98%).

Tambin se puede realizar una prueba de hiptesis para igualdad de
Varianzas:

vs .
Estadstico de Prueba: ( )
2
2
1 1
X
C
Y
S
F f n , m
S
= . R.C. =
( ) { }
1 1
C C
F | F f n , m

> , dado.

Si la hiptesis Nula es rechazada, se concluye que las varianzas
poblacionales no son iguales. En caso contrario podemos asumir que las
varianzas poblacionales son iguales.
2
2
X
Y

2
0 2
1
X
Y
H :

=

2
0 2
1
X
Y
H :



Las hiptesis de inters a ser probadas son:
vs
0
0
0
X Y
a X Y
X Y
H :
<

>

, donde
0
es un valor particular.

Usualmente
0
se toma como cero y entonces hablamos de una prueba de
Igualdad de Medias.

Caso I:
2 2 2
X Y
= = . El estadstico de prueba es:
( ) ( )
( ) 2
1 1
X y
C
p
X Y
T t n m
S
n m

= +
+
.
La regin crtica es similar al caso de una muestra aleatoria: R.C. =
, dado. El valor P de esta prueba se calcula
como:
( ) ( )
2
C
Vp P t n m T = + > .


Caso II:
2 2
X Y
. El estadstico de Prueba es:
.
La regin crtica es similar al caso anterior: R.C. =
( ) { }
C C
T | T t

> ,
dado. El valor P de esta prueba se calcula como:
( ) ( )
2
C
Vp P t n m T = + > .

0 0 X Y
H : =
( ) { }
2
C C
T | T t n m

> +
( ) ( )
( )
2 2
X y
C
X Y
X Y
T t
S S
n m

=
+






7.7. Prueba de hiptesis para la proporcin
Concepto de proporcin.
n = tamao de la muestra
x = nmero de xitos en la muestra

n
x
p =
Estadstico para la proporcin de una poblacin
n
pq
p p
z

=



Proporcin conjunta.

2 1
2 2 1 1
n n
p n p n
p
c
+
+
=
=
1
n Tamao de la muestra 1
=
2
n Tamao de la muestra 2
=
1
x Nmero de xitos en la muestra 1
=
2
x Nmero de xitos en la muestra 2



Estadstico para la proporcin de una poblacin conjunta.

2 1
2 1 2 1
) ( ) (
n
pq
n
pq
p p p p
z
+

=




7.8. Prueba de hiptesis para la diferencia de proporciones


Algunas veces estamos interesados en analizar la diferencia entre las
proporciones de poblaciones de grupos con distintas caractersticas. Por ejemplo,
pensemos que la administracin de las tiendas Oxxo cree, sobre la base de una
investigacin, que el porcentaje de hombres que visitan sus tiendas 9 o ms veces
al mes (clientes frecuentes) es mayor que el porcentaje de mujeres que hacen lo
mismo. Las especificaciones requeridas y el procedimiento para probar esta
hiptesis es la siguiente:

1. Las hiptesis nula y alternativa son las siguientes:

0 =
M H o
P P H , la proporcin de hombres que reportan 9 o ms visitas
por mes es la misma o menor que la proporcin de mujeres que hacen lo
mismo.

0 > =
M H a
P P H , la proporcin de hombres que reportan 9 o ms visitas
por mes es mayor a la proporcin de mujeres que hacen lo mismo.


La informacin proporcionada es:

45 =
H
n

71 =
M
n



58 . =
H
P

42 . =
M
P


16 . 42 . 58 . = =
M H
P P



2. Especifica el nivel de significacin de 05 . = . El valor crtico para la prueba
de una sola cola es de 1.64.


3. Estima el error estndar de la diferencia de las dos proporciones:


|
|

\
|
+ =

M H
p
n n
P P s
m h
1 1
) 1 (


donde:

M H
M M H H
n n
P n P n
P
+
+
=


P
H
= proporcin muestra de hombres (H)
P
M
= proporcin muestra de mujeres (M)
N
H
= tamao de muestra hombres
N
M
= tamao de muestra mujeres

Por lo tanto:

48 . 0
71 45
) 42 (. 71 ) 58 (. 45
=
+
+
= P


y
10 . 0
71
1
45
1
) 48 . 1 ( 48 . =
|

\
|
+ =
m h
p
s









4. Calcula de prueba estadstica:


m h
p
o
s
H es proporcion entre diferencia observadas es proporcion entre diferencia
Z

=
) _ _ _ ( ) _ _ _ (



60 . 1
10 .
) 0 ( ) 42 . 58 (.
=

= Z



La hiptesis nula es aceptada porque el valor de la Z calculada es menor que el
valor crtico Z. La administracin no puede concluir con un 95 por ciento de
confianza que la proporcin de hombres que visita 9 o ms veces los Oxxo es
mayor que la proporcin de mujeres.


SPSS no cuenta con procedimientos para hacer pruebas de hiptesis de
proporciones. Probemos si el porcentaje de hombres dueos de microempresas
es estadsticamente diferente del porcentaje de mujeres.


97 . 72
314 1634
) 1 . 16 ( 314 ) 9 . 83 ( 1634
=
+
+
= P


y
0274 . 0
314
1
1634
1
) 73 .. 1 ( 73 .. =
|

\
|
+ =
m h
p
s









74 . 24
0274 .
) 0 ( ) 161 . 839 (.
=

= Z



La hiptesis nula es rechazada porque el valor de la Z calculada es mayor que el
valor crtico Z. Podemos concluir que el porcentaje de hombres dueos de
microempresas es estadsticamente superior al porcentaje de mujeres propietarias
de microempresas.


7.9. Prueba de hiptesis para la varianza
Si la varianza s de una poblacin normal es desconocida, y queremos
verificar si es igual o no a determinado valor, podemos plantear las siguientes
pruebas:

1)
, , .

El estimador de la varianza poblacional s es la varianza muestral S, y la
variable aleatoria asociada con el estadstico es la distribucin chi cuadrado,
definida como:

Si X1, X2, Xn es una muestra aleatoria de tamao n tomada de una
poblacin normal, y si S es la varianza muestral, entonces el estadstico de
prueba bajo H0 se calcula como:

Debe tenerse en cuenta que como la distribucin chi cuadrado no es
simtrica, entonces las regiones de crticas deben calcularse por separado
para cada tipo de prueba.

El criterio de decisin es el siguiente: Rechace la hiptesis nula si:
cuando la hiptesis alternativa sea
cuando la hiptesis alternativa sea
cuando la hiptesis alternativa sea , o
equivalentemente se acptala hiptesis nula si:
Al igual que en el caso de la media poblacional, el criterio de rechazo puede
basarse en el clculo del valor P, o en el clculo del lmite fsico para la
varianza muestral de acuerdo con las caractersticas evaluadas. Es decir, en
vez de decidir la aceptacin o el rechazo segn el estadstico de prueba X2,
se puede definir el lmite para el valor mximo y/o mnimo que pueda tomar la
varianza muestral S. Los criterios de decisin seran: Rechace la hiptesis
nula si:

cuando la hiptesis alternativa sea
cuando la hiptesis alternativa sea
cuando la hiptesis alternativa sea
, o



7.10. Prueba de hiptesis para la relacin de varianza
Se tienen dos poblaciones normales e independientes con varianzas
desconocidas s1 y s2, respectivamente, y se desea verificar la hiptesis de que
las varianzas son iguales contra una hiptesis alternativa de que son diferentes.
Las posibles hiptesis pueden ser:
, ,

Para verificar las hiptesis anteriores nos basamos en el hecho de que la siguiente
relacin tiene una distribucin muestral F con n1-1 y n2-1 grados de libertad:


Bajo la hiptesis nula de que , el estadstico de prueba se calcula como

El criterio de decisin es:

Rechace H0 si cuando la hiptesis alternativa es
Rechace H0 si cuando la hiptesis alternativa es
Rechace H0 cuando la hiptesis alternativa
es



7.11.























Bibliografa

Revista Colombiana de Estadstica Volumen 29 No 1. pp. 57 a 76. Junio
2006
www.mty.itesm.mx/egap/deptos/cee/mc/documentos_curso/sesion7/
Kurincic, G.; Estadstica Herramientas de Inferencia; Ed. Cooperativas;
2001.
Garca Barbancho; Estadstica Elemental Moderna; Ed. Ariel; 1986.
Kazmier, L y A. Daz Mata, A; Estadstica aplicada a la Administracin y a
la Economa; Ed. McGrawHill; 1993.
Mendenhall, Scheaffer & Reinmuth: Estadstica para Administracin y
Economa; Ed. Iberoamericana; 1986.
Novales, A.; Estadstica y Econometra; Ed. . McGrawHill; 1997.
Prez, C.; Tcnicas de Muestreo Estadstico; Ed. Alfaomega; 2000.
Ya Lun Chow; Estadstica; Ed. Iberoamericana; 1985.
























Actividades Adicionales Complementarias
1.- Determine si la regin de rechazo es de la cola derecha, de la cola izquierda o de dos
colas.
a. H
0
: = 15, H
1
: 15, =.05
b. H
0
: p 0.7, H
1
: p > 0.7, =.02
2.- Se sabe que el tiempo promedio de secado de una pintura est normalmente distribuido
con media de 75 min. y desviacin estndar de 9 min. Se utiliza un aditivo para secado
rpido en 25 piezas. Se quiere probar que el tiempo promedio de secado ha disminuido por
el uso del aditivo siempre que el tiempo promedio de secado de la muestra sea menor que
70,8 min.
a) a Halle el nivel de significancia e interprete el resultado
b) Cual seria si en muestras particulares de tamao n=25 el promedio del promedio del
tiempo de secado fuera 75 , 71 , 70 = = = x x x
c) Calcule (72), (70.8), (70) y (67) y grafique comparativamente y
3.- Suponga que el espesor de un componente de un semiconductor es una
dimensin crtica. El proceso de produccin de tal caracterstica se distribuye
normalmente con una desviacin estndar de 0.6 milsimas de pulgada. Para
controlar el proceso se toman muestras peridicas de veinte piezas, y se define un
lmite de control con base en una probabilidad de 0.01 de que la varianza muestral
exceda dicho lmite, si el proceso est bajo control. Qu se puede concluir si para
una muestra dada la desviacin estndar es 0.84 milsimas de pulgada?