Está en la página 1de 22

UNIDAD IV.

PRUEBAS DE HIPTESIS
CONCEPTOS BSICOS DE PRUEBAS DE HIPTESIS
La inferencia estadstica est relacionada con los mtodos para obtener conclusiones o
generalizaciones acerca de una poblacin. Estas conclusiones acerca de la poblacin pueden estar
relacionadas con la forma de la distribucin de una variable aleatoria, con los valores de uno o
varios parmetros de la misma.
El campo de la inferencia estadstica se divide en dos:
a) Por un lado, el inters de la estimacin de los parmetros de una distribucin y,
b) Las pruebas de hiptesis.
En el caso de la estimacin, se trata de elegir el valor de un parmetro de la poblacin, mientras que
en las pruebas de hiptesis se trata de decidir entre aceptar o rechazar si un valor especificado del
parmetro corresponde a la poblacin (por ejemplo, si el tiempo de vida de un artculo es un valor
0 o no lo es).
En el campo de las pruebas de hiptesis se pueden considerar dos reas:
a) Pruebas de hiptesis respecto a los parmetros, para determinar si un parmetro de una
distribucin toma o no un determinado valor, o si puede tomar un conjunto de valores y,
b) Pruebas de Bondad de Ajuste, para definir o establecer si un conjunto de datos se puede
modelar mediante una determinada distribucin.
En las secciones siguientes solamente se aborda, el primer inciso, es decir, las pruebas de hiptesis.
Una hiptesis estadstica es una proposicin o conjetura que se hace de la poblacin o poblaciones
respecto a sus respectivos parmetros. Por ejemplo, si con base en una muestra aleatoria se tiene
que decidir si un proceso est produciendo una determinada media, digamos = 100, o si hay que
decidir si una determinada droga sirve a un grupo especfico de pacientes, lo anterior, puede
traducirse en un lenguaje de Pruebas de Hiptesis, y utilizar metodologas estadsticas para tomar
una decisin al respecto.
Estadsticamente una prueba de hiptesis es una afirmacin o conjetura de una o ms poblaciones.
Nunca se sabe con absoluta certeza la verdad o falsedad de una hiptesis estadstica, a no ser que se
examine la poblacin entera. Esto ltimo, por supuesto sera imprctico en la mayora de las
situaciones, es por esto que en lugar de la poblacin, se toma una muestra aleatoria representativa
de la poblacin de inters y se utilizan los datos de tal muestra para proporcionar evidencia que
confirme o no la hiptesis planteada.
Una prueba de hiptesis consiste en contrastar dos hiptesis estadsticas. Tal contraste involucra la
toma de decisin acerca de las hiptesis. La decisin consiste en rechazar o no una hiptesis en favor
de la otra. En el proceso de una prueba de hiptesis para una toma de decisin estadstica se
involucran dos tipos de hiptesis: Hiptesis nula e hiptesis alternativa, stas se abordan con ms
detalle a continuacin.

Hiptesis Nula y Alternativa


La hiptesis nula denotada por 0 es una declaracin afirmando ningn cambio o ningn efecto en el
estado de la naturaleza. 0 se considera cierta, o sin cambio alguno salvo que los datos proporcionen
evidencia convincente de que es falsa. Comnmente es planteada con el objetivo de ser rechazada, ya
que se pretende probar que los datos dan evidencia de algn cambio.
Prof. Felipe R. Tuz Poot

91

La hiptesis alternativa es una declaracin que contradice 0 y es denotada por o bien 1 . Es


aceptada slo si los datos proporcionan evidencia convincente de su verdad. Comnmente es
planteada como la hiptesis del investigador, la cual es la que se pretende aceptar rechazando 0 .
Ejemplo
Supngase que se sospecha que los nios tienen un CI ms alto si comen alimentos con aceite de
pescado durante seis meses.
La hiptesis alternativa :
Los nios que comen alimentos con aceite de pescado por seis meses tienen un CI mayor que los
nios que no lo hacen.
La hiptesis nula 0 :
Los nios que comen alimentos con aceite de pescado durante seis meses no muestran un mayor CI
que los nios que no lo hacen
En un experimento se consideran dos grupos: un grupo de control al que no se le proporciona
alimentos con aceite de pescado y otro grupo al que s se le proporciona. A ambos grupos se les mide
el CI al inicio del experimento y despus de los seis meses del experimento.
De las pruebas del coeficiente intelectual del grupo de control, se encuentra un CI medio de 100 antes
del experimento y 100 despus, esto es, no hay aumento.
Los nios alimentados con aceite de pescado muestran un aumento de 100 a 106. Esto parece ser un
aumento, pero aqu es donde la estadstica entra en el proceso de comprobacin de hiptesis. Es
necesario comprobar si el aumento es significativo como para afirmarlo a nivel poblacional.
Usando una prueba adecuada, el investigador puede comparar las dos medias finales de los dos
grupos (100 y 106), teniendo en cuenta el aumento, el nmero de datos en las muestras y la
asignacin al azar relativa de los grupos. El resultado permitir determinar si existe evidencia
suficiente para apoyar si la conjetura hecha por el investigador es afirmativa.
Es importante tener en cuenta que, no rechazar la hiptesis nula no es lo mismo que aceptarla. Es
slo que este experimento en particular no puso de manifiesto que el consumo de alimento con aceite
de pescado no afecta al coeficiente intelectual. Este principio se encuentra en la esencia de la prueba
de hiptesis.

Errores de tipo I y tipo II


Al utilizar un proceso de prueba de hiptesis para tomar decisiones sobre el parmetro poblacional,
existe el riesgo de llegar a una conclusin equivocada, eso es, al aplicar la metodologa de prueba de
hiptesis, puede cometerse uno de dos tipos de error: el error de tipo I y el error de tipo II.
Error tipo I: Se presenta cuando se rechaza la hiptesis nula siendo cierta y no debera rechazarse.
Nivel de significancia. Es la probabilidad de cometer un error tipo I, denotado por alfa, .
Nivel de confianza: Es la probabilidad de la decisin correcta de aceptar la hiptesis nula cuando es
verdadera, esta probabilidad se denota por 1 .
Error tipo II: Este tipo de error se presenta cuando no se rechaza la hiptesis nula siendo falsa y
debera rechazarse.

Prof. Felipe R. Tuz Poot

92

Caracterstica de la prueba: Es la probabilidad de cometer un error de tipo II y se denota por .


Potencia de la prueba o poder de la prueba. Es la probabilidad de la decisin correcta de rechazar la
hiptesis nula cuando es falsa, esta probabilidad es denotada por 1 .
En la siguiente tabla se resumen las probabilidades segn la toma de decisin en una prueba de
hiptesis.
Estado de H0
Decisin
Aceptar 0
Rechazar 0

0 es verdadera
Decisin correcta
1 a = Nivel de confianza
Error tipo I
a = Nivel de significancia

0 es falsa
Error tipo II

b = caracterstica de la prueba
Decisin correcta
1 b = potencia de la prueba

Una hiptesis es una afirmacin sobre un parmetro poblacional, la cual ser aceptada o rechazada
en base a la evidencia que proporciona la muestra. La hiptesis inicial que se define sobre la
poblacin se llama hiptesis nula; pero si rechazamos esa hiptesis nula debemos tener una hiptesis
alternativa, la cual tomaremos como cierta si la hiptesis inicial o nula es falsa.
Ejemplo
En un juzgado se le acusa a una persona de un delito, desde el punto de vista legal la persona acusada
se le considera inocente (hiptesis nula o inicial) hasta que se demuestre lo contrario. Si el juez con
todas las evidencias presentadas determina ms all de toda duda razonable que la persona es
culpable; entonces rechaza la hiptesis nula y determina como verdadera una hiptesis alternativa
(culpable!).
Para que las reglas de decisin sean buenas, deben disearse de modo que minimicen los errores de
decisin, y no es una cuestin sencilla, porque para cualquier tamao de la muestra, un intento de
disminuir un tipo de error (por ejemplo error tipo I) suele ir acompaado de un crecimiento del otro
tipo de error (error tipo II). En la prctica un tipo de error puede ser ms grave que el otro, y debe
alcanzarse un compromiso que disminuya el error ms grave, la nica forma de disminuir ambos a
la vez es aumentar el tamao de la muestra, que no siempre es posible.

P(Error tipo II) = b


Bajo H0

P(Error tipo I) = a
Bajo Ha

Valor crtico

En general, en una prueba de hiptesis se trata de minimizar el error tipo I, es decir, el error de
rechazar 0 y aceptar la hiptesis alternativa, por lo que hay que cuidar que la probabilidad de
este error sea lo ms pequea posible. Como se mencion anteriormente, la hiptesis del
investigador se encuentra en la hiptesis alternativa, por lo que se tratar de buscar evidencia en la
Prof. Felipe R. Tuz Poot

93

muestra para rechazar la hiptesis nula y aceptar la alternativa, esto trae como consecuencia que se
tenga probabilidad de cometer el error tipo I pero con la probabilidad ms pequea.
Las dos decisiones posibles que se pueden hacer nos llevan a una de las dos siguientes conclusiones:
1) La conclusin de que hay suficiente evidencia para apoyar la hiptesis alternativa (rechazar
la hiptesis nula a favor de la alternativa)
2) La conclusin de que no hay pruebas suficientes que apoyen la hiptesis alternativa (no
rechazar la hiptesis nula a favor de la alternativa)
Estadstico de Prueba: El estadstico de prueba es el que permite tomar la decisin en una prueba
de hiptesis establecida por el investigador, ya que es una funcin de la muestra con la caracterstica
de tener una distribucin, misma que se utiliza para calcular probabilidades que permiten definir la
regin de rechazo y la regin de aceptacin respecto a la hiptesis nula. Sin el conocimiento de dicha
distribucin no sera posible definir dichas regiones, pues todo lo relacionado a inferencia estadstica
es basado en probabilidades de una distribucin terica de la poblacin.

Regin de aceptacin y de rechazo


Regin de aceptacin: La regin de aceptacin es un subconjunto de valores del estadstico de
prueba para los cuales la hiptesis nula no se rechaza.
Regin de rechazo: Es el conjunto de valores fuera de la regin de aceptacin. Si el valor del
estadstico de prueba se encuentra dentro de esta regin, la hiptesis nula es rechazada. En tales
casos, se dice que la hiptesis nula ha sido rechazada con un nivel de significacin .
Valor crtico: Es el valor o el punto lmite que divide a la regin de rechazo y la regin de aceptacin.
En un proceso de prueba de hiptesis, para tomar la decisin con respecto a la hiptesis nula (aceptar
o rechazar esta hiptesis) se debe determinar el valor crtico en la distribucin de la estadstica de
prueba. El valor crtico divide la regin de rechazo de la regin de aceptacin.
Por ejemplo, supngase que se plantea una hiptesis respecto al parmetro y adems el estadstico
de prueba adecuado para la prueba es, el cual tiene una distribucin normal estndar.
Considerando la probabilidad del error tipo I, es decir estableciendo , se utiliza la distribucin de
probabilidad del estadstico de prueba para establecer las regiones de rechazo y las de aceptacin
respecto a la hiptesis nula.
Si lo que se desea probar es:
0 : = 0 contra la hiptesis alternativa : 0
con un nivel de significancia (es decir, permitir el error tipo I con la probabilidad establecida)
entonces las regiones de rechazo se presenta en la siguiente figura con = 0.05

Prof. Felipe R. Tuz Poot

94

Regin crtica o
zona de rechazo de
la hiptesis nula

Zona de aceptacin
de la hiptesis
nula

Regin crtica o
zona de rechazo de
la hiptesis nula

95%

=0.025

=0.025

donde 1 2 usando la distribucin normal estndar son tales que:


( < 1 ) = /2
En el caso particular = 0.05 se tiene que
1 = 1.96

y ( > 2 ) = /2.

2 = 1.96

Las reas sombreadas en la figura, son las llamadas regiones crticas o zonas de rechazo de la hiptesis
nula, los valores 1 y 2 son denominados puntos crticos. As que si al calcular el estadstico de
prueba e, el valor de este se encuentra dentro de la regin de rechazo, entonces se rechaza 0 , en
caso contrario, se dice que no hay suficiente evidencia para rechazarla. Ahora, si el valor de e
correspondiente a la muestra observada cae dentro de la zona de aceptacin en la figura, el
investigador se inclinara a pensar que no reuni suficiente evidencia para poder rechazar la hiptesis
nula a favor de la alternativa, aunque aqu tambin cabe la posibilidad de cometer un error en la
decisin, que ser del tipo II.
En la prctica, los niveles de significancias ms usuales son: 1%, 5% o bien el 10%.
Las pruebas de hiptesis pueden ser de una o de dos colas dependiendo del planteamiento que se
desee probar en la hiptesis alternativa. Si al establecer la hiptesis alternativa, sta es de la forma
: > 0 , entonces se considera que se trata de una prueba de hiptesis de una cola a la derecha, o
sea, que la regin de rechazo estar en el lado derecho de la distribucin del estadstico de prueba y
se considera la prueba con nivel de significancia ; ahora, si se establece la hiptesis alternativa
: < 0 , entonces se trata de prueba de hiptesis de una cola a la izquierda y se especifica la
prueba con nivel de significancia ; por ltimo si el signo es de desigualdad en la hiptesis alterna o
sea, es : 0 , se trata de una prueba de hiptesis de dos colas, una a la derecha y otra a la
izquierda, como son dos las zonas de rechazo, se tendr que dividir el nivel de significancia entre
dos (ste el caso presentado en la figura anterior). Observe, en las siguientes grficas se presentan
las regiones de rechazo que se dan en cada caso mencionado:

Prueba de hiptesis de una cola a la derecha ( : > 0 )

Prof. Felipe R. Tuz Poot

95

Prueba de hiptesis de una cola a la izquierda ( : < 0 )

Prueba de hiptesis de dos colas ( : 0 )


Los pasos para realizar una prueba de hiptesis son los siguientes:
1. Plantear la hiptesis nula
2. Plantear la hiptesis alternativa
3. Especificar el nivel de significancia
4. Considerar el tamao de muestra
5. Establecer los valores crticos que definen las regiones de rechazo de las de no rechazo.
6. Determinar cul debe ser la estadstica de prueba a emplear
7. Coleccionar los datos de la muestra y calcular el valor muestral de la Estadstica de prueba
apropiada
8. Determinar si la estadstica de prueba calculada corresponde a la regin de rechazo o la
regin de aceptacin. Recurdese que la ubicacin de estas regiones son respecto al signo de
desigualdad (, >, <) que se encuentra en la hiptesis alternativa.
9. Determinar si se rechaza o no la hiptesis nula con base a la regla de decisin
10. Expresar la decisin estadstica en trminos del problema planteado

Potencia de una prueba


Anteriormente, en el tema correspondiente al Error tipo II, se consider el concepto de potencia de
la prueba como la probabilidad de la decisin correcta de rechazar la hiptesis nula cuando es
realmente falsa. Aqu se abordar este concepto un poco ms amplio, ya que en muchas ocasiones se
tiene la necesidad de elegir una prueba respecto de otra, para esto, es comn comparar la prueba
estadstica respecto a su propiedad de potencia. Por supuesto, una vez determinada la potencia de
dos pruebas por ejemplo, se tomara la que tenga mayor potencia. En el ejemplo se explica la forma
de determinar la potencia de una prueba.
Recordemos que la potencia se calcula como 1 , la cual es interpretada como la probabilidad de
rechazar correctamente una hiptesis nula que es falsa.
Ejemplo
Supngase que se tiene el inters en la rapidez de combustin del propulsor slido utilizado para
impulsar los sistemas de expulsin de la tripulacin de un avin. Adems, considrese que estas
medidas tienen una distribucin aproximadamente normal con desviacin estndar de 2.5 cm/s, el
inters se enfoca en la media de la rapidez de combustin, parmetro de la distribucin. Para este

Prof. Felipe R. Tuz Poot

96

estudio se desea comprobar estadsticamente si la media de combustin es 50 cm/s o no lo es, es


decir las hiptesis de inters son:
: = 50

vs

: 50

Supngase que la regin de no rechazo de es:


= { : 48.5 51.5}
Suponiendo que la verdadera media es = 52 , considerando = 10 . El inters aqu es el de
determinar la potencia de la prueba, para ello determnese la probabilidad del error tipo II es decir, .
=Probabilidad (Aceptar 0 cuando es falsa)
=Probabilidad (Aceptar 0 cuando = 52)
=Probabilidad (48.5 51.5 cuando = 52)
48.552
52
51.552
= (

)
2.5/10

2.5/10

2.5/10

= (4.43 0.63)
= (0.63 4.43)
= ( 0.63) ( 4.43)
= 0.2643 0000
= 0.2643
Entonces la potencia de la prueba es: 1 = 1 0.2643 = 0.7357 cuando = 52.
La potencia de la prueba es una medida descriptiva y concisa de la sensibilidad de una estadstica,
donde la sensibilidad se entiende como la habilidad de la prueba para detectar diferencias; en el caso
del ejemplo, la sensibilidad de la prueba para detectar la diferencia entre la rapidez de combustin
media de 50 cm/s y 52 es 0.7357, o sea, si la media verdadera es en realidad 52 cm/s, esta prueba
rechazar : = 50 y detectar esta diferencia en un 73.57% de las veces. Podra decirse tambin
que la prueba tiene la capacidad de rechazar : = 50 con un 73.57% de confianza cuando la
verdadera media es = 52. Si este valor potencia, se considera muy bajo, el investigador podra
incrementar el tamao de la muestra.

Prof. Felipe R. Tuz Poot

97

PRUEBA DE HIPTESIS A PARTIR DE UNA MUESTRA


Prueba de hiptesis para la media
Se comenzar estudiando las pruebas de hiptesis para la media de una sola poblacin sobre la que
se desea hacer inferencia. Los estadsticos a utilizar son: el estadstico y el estadstico , cul se
emplear? Pues depender de si se conoce o desconoce y considerando ciertas caractersticas de
la muestra y la poblacin.
Prueba de hiptesis para la media con conocida
Las hiptesis que pueden ser de inters al investigador respecto a la media son:
I 0 : = 0 : 0
II 0 : = 0 : > 0
III 0 : = 0 : < 0
donde 0 es una constante.
Para las hiptesis establecidas aqu, es importante considerar que la prueba slo es vlida bajo
cualquiera de las siguientes condiciones:
la muestra aleatoria es obtenida de una poblacin con distribucin normal o aproximadamente
normal
ii) Se desconoce la distribucin poblacional correspondiente a la muestra, pero el tamao de la
muestra n es grande, mayor o igual a 30.
i)

As, por la teora de distribuciones muestrales, y considerando el error tipo I se tiene que el
estadstico de prueba adecuado es:
0
=

donde:
es la media muestral con el tamao de muestra
0 es la media poblacional planteada en la hiptesis nula
es la desviacin estndar poblacional.
El estadstico tiene una distribucin normal estndar o aproximadamente normal, entonces, la
regin de rechazo de 0 con el nivel de significancia es:
a) Para las hiptesis planteadas en I la regin de rechazo est dada por los valores que se
obtienen de z y que cumplen || > 2
b) Para las hiptesis planteadas en II la regin de rechazo est dada por los valores que obtienen
de z que cumplan >
c) Para las hiptesis planteadas en III la regin de rechazo est dada por los valores que se
obtienen de z que cumplan <
Ejemplo
Un ingeniero establece que en promedio las mediciones del dimetro del tubo de albail es mayor
que 30. Para comprobar que lo que establece el ingeniero efectivamente es lo correcto se toma una
muestra aleatoria de 100 tubos del cual resulta una media de 32 cm y una varianza de 4. Apoya la
muestra la aseveracin del ingeniero? Responda con un 95% de confianza.

Prof. Felipe R. Tuz Poot

98

Solucin
La hiptesis que se desea probar es:
0 : = 30 : > 30.
Este ejemplo es el caso ii) planteado en esta seccin pues es desconocida pero el tamao de
muestra = 100 es grande.
Se estima la varianza poblacional 2 a travs de la varianza muestral 2 = 4. As, el estadstico de
prueba es


32 30
=
=
= 10

100
Y el valor crtico es z = 0.05 = 1.64. Ya que calculada cumple que > 0.05 = 1.64 entonces se
rechaza la hiptesis nula a favor de la hiptesis alternativa, esto es, se acepta la hiptesis que plantea
el ingeniero con un 95% de confianza.
Prueba de hiptesis para la media , con desconocida.
Las hiptesis que pueden ser de inters al investigador respecto a la media son:
I 0 : = 0 : 0
II 0 : = 0 : > 0
III 0 : = 0 : < 0
donde 0 es una constante.
Para las hiptesis establecidas es importante que la muestra aleatoria obtenida est bajo cualquiera
de las siguientes condiciones:
la muestra aleatoria es obtenida de una poblacin con distribucin normal o aproximadamente
normal
ii) Se desconoce la distribucin poblacional correspondiente a la muestra, pero el tamao de la
muestra n es grande, mayor o igual a 30.
i)

As, bajo cualquiera de estas condiciones que cumpla la muestra, se tiene por teora de distribuciones
muestrales y considerando el error tipo I que, el estadstico de prueba adecuado para cualquiera de
las hiptesis planteadas es:
0
=

el cual tiene una distribucin con 1 grados de libertad y donde:


es la media muestral con el tamao de muestra

0 es la media poblacional planteada en la hiptesis nula


es la desviacin estndar muestral.

Considerando la distribucin (distribucin con 1 grados de libertad), se puede determinar la


regin de rechazo y la regin de aceptacin de 0 con el nivel de significancia .

Prof. Felipe R. Tuz Poot

99

a) Para las hiptesis del caso I, la regin de rechazo es vlida para cada valor que cumple:
|| > 2,1
b) Para las hiptesis del caso II, la regin de rechazo es vlida para cada valor t que cumple: >
,1
c) Para las hiptesis del caso III, la regin de rechazo es vlida para cada valor que cumple:
< ,1
Notas
1) En el caso i) no importa el tamao de muestra, siempre ser vlido utilizar el estadstico .
2) En el caso ii) cuando el tamao de muestra es grande, la distribucin con 1 grados de
libertad se aproxima a la distribucin normal estndar, por lo que podemos utilizar el
estadstico de prueba

0
=

con la desviacin estndar poblacional estimada por la desviacin estndar muestral .


3) Cuando no se cumple ninguno de los casos i) y ii), es decir, se desconoce la distribucin de la
que proviene la muestra y el tamao de muestra es < 30 , no es posible utilizar los
estadsticos y para resolver la prueba de hiptesis respecto a la media. En esta situacin
se emplea metodologa estadstica no paramtrica, que en este curso no ser abordada.
Ejemplo
En una fbrica de materiales se fabrican unas varillas con una resistencia de 4500 kg/cm2. Un
ingeniero sospecha que cierta maquinaria tiene fallas en la fabricacin y asegura que la mquina est
fabricando varillas con resistencia diferente a 4500 kg/cm2, por lo propone un ajuste a dicha
maquinara. Con la finalidad de mostrar que la mquina est fallando, un da al azar se toma una
muestra aleatoria de 10 varillas de la produccin, al probarlas a la tensin hasta la ruptura se obtiene
una resistencia media de 4200 kg./cm2, con una desviacin estndar de 200 kg. /cm2. Compruebe
con un nivel de significancia de 0.05 si la mquina realmente necesita un ajuste. Considere que la
variable poblacional resistencia tiene distribucin normal.
Solucin
La muestra proviene de una poblacin con distribucin normal, se desconoce la desviacin estndar
poblacional , y adems el tamao de muestra es pequeo, por lo que se usar la distribucin de
student para estimar el promedio poblacional, (si el tamao de muestra fuese grande podra usarse
s como estimacin para y usar el estadstico de prueba , como se indica en la seccin anterior).
La hiptesis a probar es:
0 : = 4500 : 4500.
El estadstico de prueba es:
0 4200 4500
300
=
=
=
= 4.74
200
63.246

10
El valor crtico es ,1 = 0.025,9 = 2.262.
La regin de rechazo est dada por || > /2,(1). Entonces el valor del estadstico cae en la regin
de rechazo, por tanto se rechaza la hiptesis nula y se concluye que los datos favorecen la hiptesis
planteada por el ingeniero, por lo que se sugiere que la maquinaria entre a revisin con un 95% de
confianza.
Prof. Felipe R. Tuz Poot

100

Prueba de hiptesis para la proporcin


Prueba de hiptesis para la proporcin poblacional , en muestras grandes ( ).
Como se ha mencionado en la seccin de intervalos de confianza, la proporcin observada de xitos

en la muestra, = , es un estimador de la proporcin poblacional , que en realidad resulta la media


de una poblacin Bernoulli.
Las hiptesis que pueden ser de inters respecto a la proporcin de una poblacin ()
son:
I 0 : = 0 : 0
II 0 : = 0 : > 0
III 0 : = 0 : < 0
Considerando el error tipo I, el estadstico de prueba adecuado para cualquiera de las hiptesis
respecto a , planteadas es:
0
=

0 0

la cual tiene aproximadamente una distribucin normal estndar, justificada por el teorema del
lmite central, debido a que el tamao de la muestra es 30.
En este estadstico de prueba:
es la proporcin poblacional estimada con el tamao de muestra
0 es la proporcin hipottica planteada en la hiptesis nula y 0 = 1 0
Considerando la distribucin aproximada de es posible definir las regiones de rechazo para cada
hiptesis planteada, las cuales resultan ser:
a) Para las hiptesis del caso I, la regin de rechazo es vlida para los valores de que cumplan
|| > 2
b) Para las hiptesis del caso II, la regin de rechazo es vlida para los valores de que cumplan
>
c) Para las hiptesis del caso III, la regin de rechazo es vlida para los valores de que cumplan
<
Ejemplo
Un fabricante de insecticidas para moscas, desea comprobar que una nueva marca Matamos K es
mucho ms efectivo que una determinada marca X que se encuentra en el mercado. La marca X
mata en promedio 800 de 1000 moscas. Para comprobar si la nueva marca es ms efectiva, se realiza
un experimento en el cual, se colocan 1000 moscas en un cuarto y se usa el insecticida Matamos K
y resulta que sucumben 815. De acuerdo a estos datos es estadsticamente ms efectiva esta nueva
marca? Justifique con un 99% de confianza.
Solucin
La hiptesis de inters a probar es: 0 : = 0.80 : > 0.80.
Se est en el caso de que la muestra es grande, por lo que el siguiente proceso tiene validez
=

Prof. Felipe R. Tuz Poot

815
=
= 0.815
1000

101

El estadstico de prueba es:


=

0
0 0

0.815 0.800
(0.8)(0.2)1000

0.015
= 1.186
0.01265

Adems se tiene que el valor crtico es = 0.01 = 2.33. Por lo tanto como el estadstico = 1.186
calculado es tal que < 0.01 = 2.33, es decir, el valor del estadstico no cae en la regin de rechazo,
no es posible rechazar 0 a favor de la hiptesis alternativa.
Se concluye que no hay razn suficiente para decir que el nuevo insecticida es ms eficiente que el
de la marca X, es decir, los datos no apoyan a la hiptesis del fabricante.

Prueba de hiptesis para la varianza


Prueba de hiptesis para la varianza poblacional, , cuando la poblacin tiene distribucin
normal o aproximadamente normal
Para realizar la prueba de hiptesis para la varianza poblacional, 2 slo se abordar el caso ms
comn en el que la media poblacional es desconocida. Hay muchas situaciones prcticas donde 2
es el objetivo principal de una investigacin experimental; as, este parmetro puede asumir una
importancia mucho mayor que la de la media poblacional. Por ejemplo, los instrumentos de medicin
cientfica deben producir valores insesgados con un error de medicin muy pequeo; el altmetro de
una aeronave que mide en promedio la altitud correcta sera de poco valor si la desviacin estndar
del error de medicin fuese 2000 metros; los repuestos que se producen en un proceso industrial
deben tener un mnimo de variabilidad con el objeto de reducir el nmero de productos cuyo tamao
est fuera de nmero de productos defectuosos. Adems, en general es deseable mantener una
varianza mnima en las mediciones para conseguir el control de determinados proceso y por lo tanto
minimizar el porcentaje de productos de poca calidad.
Las hiptesis de inters respecto a la varianza poblacional 2 son:
I 0 : 2 = 02 : 2 02
II 0 : 2 = 02 : 2 > 02
III 0 : 2 = 02 : 2 < 02
donde 02 es una constante positiva, un valor hipottico.
Es importante hacer nfasis de que bajo la condicin de que la muestra obtenida es de una
distribucin normal, se tiene, por la teora de distribuciones muestrales y considerando el error tipo
I que el estadstico de prueba adecuado para cualquiera de las hiptesis establecidas para 2 es:
2 =

( 1) 2
02

La cual tiene una distribucin Chi- cuadrada con 1 grados de libertad y donde
02 es la varianza establecida en la hiptesis nula
2 es la varianza muestral con tamao de muestra
A partir de esta distribucin correspondiente al estadstico de prueba, es posible definir las regiones
de rechazo para cada hiptesis planteada:

Prof. Felipe R. Tuz Poot

102

a) Para las hiptesis del caso I, la regin de rechazo est formada por los valores de 2 que
2
cumplen que 2 > 2,1 o 2 < 1

,1
2

b) Para las hiptesis del caso II, la regin de rechazo est formada por los valores de 2 que
2
cumplen que: 2 > ,1
c) Para las hiptesis del caso III, la regin de rechazo est formada por los valores de 2 que
2
cumplen que: 2 < 1,1
Ejemplo
Un experimentador est convencido de que su equipo de medicin tiene una variabilidad medida por
una desviacin estndar de = 2. Durante un experimento, obtuvo las observaciones 4.1, 5.2, 10.2.
Estn en desacuerdo estos datos con su posicin? Si esta respuesta es afirmativa, es necesaria la
revisin del equipo. Responda con un nivel de significancia de a = 0.1. Supngase que los datos de
medicin tienen una distribucin normal.
Solucin
La hiptesis que se desea probar es:
0 : = 2 : 2
que es equivalente a
0 : 2 = 4 : 2 4
La varianza muestral de estos datos es
3

1
= ( )2 = 10.57
2
2

=1

El estadstico de prueba es
2 =

( 1) 2
02

2(10.57)
= 5.285
4

Se sabe que se rechaza 0 si el valor que se obtiene de 2 cumple que:

2 > 2,1 o 2 < 21,1


2

2
Los valores crticos obtenidos de la tabla de la distribucin Ji-cuadrada son 2,1 = 0.05,2
= 5.99 y
2

2
2
1
= 0.95,2
= 0.103, por lo que el valor del estadstico de prueba no cae en la regin de

,1
2

rechazo, no se puede rechazar la hiptesis nula a favor de la hiptesis alternativa. Como consecuencia
no hay razn suficiente para dar una revisin al equipo con 90% de confianza.

Prof. Felipe R. Tuz Poot

103

PRUEBA DE HIPTESIS A PARTIR DE DOS MUESTRAS


Pruebas de hiptesis para diferencia de medias poblacionales, cuando las
desviaciones estndar poblacionales y son conocidas
Supngase que se tienen dos muestras aleatorias: 1 , , y 1 , , . Las pruebas de hiptesis
aqu planteadas se establecen bajo cualquiera de las siguientes condiciones.
i)
ii)

Las poblaciones de donde son extradas las muestras tienen distribucin normal o
aproximadamente normal y entre las muestras hay independencia.
Las distribuciones poblacionales de donde son extradas las muestras son desconocidas
pero los tamaos de las muestras son mayores o iguales a 30 y entre las muestras hay
independencia.

En el siguiente cuadro se presentan los posibles planteamientos de hiptesis con sus


correspondientes estadsticas de prueba y regiones de rechazo utilizando la distribucin normal
estndar.
Hiptesis
nula

Hiptesis
alternativa

= 0

= 0

> 0

= 0

< 0

Medida Estadstica
de Prueba

Regin de rechazo

( ) 0

|| > 2

2 2
+

>
<

El valor 0 se refiere a la posible diferencia entre las medias poblacionales. Cuando en el estudio se
desea probar si los promedios poblacionales son diferentes, entonces se considera 0 = 0 y los
planteamientos de las hiptesis se reducen a cualquiera de las dos formas siguientes que se
presentan a manera de ejemplo:

0 : = 0
0 :

: 0
:

Ejemplo
Se desea analizar el peso de las varillas fabricadas por dos compaas, por tanto se toman muestras
aleatorias de 100 varillas de acero que se fabrican en cada una de las compaas A y B. De la muestra
de la compaa A se obtiene un peso medio de 6.5 kg., asimismo, la muestra de la compaa B indica
un peso medio de 6.3 kg. Considerando que las desviaciones estndar poblacionales de cada
compaa son respectivamente = 0.4 kg. y = 0.3 kg. Se puede concluir que alguna de las
compaas fabrica las varillas con mayor peso? Responda estadsticamente con un 99% de confianza.
Solucin
Se desea probar la hiptesis:
0 : = :
La informacin que se tiene es = = 100, = 6.5 = 6.3. Adems las desviaciones son
conocidas, a saber, = 0.4 kg y = 0.3 kg. De manera natural, las muestras son independientes,
por lo que el estadstico de prueba es:
Prof. Felipe R. Tuz Poot

104


2 2
+

6.5 6.3
2
2
(0.4) + (0.3)
100
100

0.2
=4
0.05

El valor crtico es /2 = 0.005 = 2.58 y como el valor del estadstico de prueba es tal que || >
0.005 = 2.58, se rechaza la hiptesis nula a favor de la alternativa con una confianza del 99%, es
decir, los datos apoyan que efectivamente una de las fbricas produce varillas con mayor peso.

Prueba de hiptesis para diferencia de medias poblacionales cuando las


desviaciones estndar poblacionales y son desconocidas
Supngase que se tienen dos muestras aleatorias X1 , , X nX y Y1 , , YnY y se cumple alguna de las
siguientes condiciones:
i) Las poblaciones de las cuales se extraen las muestras tienen distribucin normal o aproximadamente
normal y entre las dos muestras hay independencia.
ii) Las distribuciones poblacionales de donde son extradas las muestras son desconocidas pero los
tamaos de las muestras son mayores o iguales a 30 y entre las dos muestras hay independencia.
Entonces, bajo la condicin i), la prueba de hiptesis para se determina de acuerdo a alguno
de los dos casos siguientes:
Caso 1: =
En este caso, los posibles planteamientos de las hiptesis con sus correspondientes estadsticas de
prueba y regiones de rechazo utilizando la distribucin de student, se presentan en el siguiente
cuadro.
Hiptesis
nula

Hiptesis
alternativa

= 0

= 0

> 0

= 0

< 0

Medida Estadstica de
Prueba
=

( ) 0
1
1
+

Regin de rechazo

|| > 2,
> ,

= + 2
2 =

( 1)2 +( 1)2

< ,

+ 2

Ejemplo
Se llev a cabo un experimento para comparar el deterioro abrasivo de dos materiales laminados
diferentes. Se probaron doce piezas del material 1, exponiendo cada una a una mquina para medir
el deterioro. De la misma manera, se probaron diez piezas del material 2. En cada caso, se observ la
profundidad del deterioro. Las muestras del material 1 dieron un deterioro promedio (registrado)
de 85 unidades con una desviacin estndar muestral de 4, mientras que las muestras del material 2
dieron un promedio de 81 y una desviacin estndar muestral de 5. Puede concluirse en el nivel de

Prof. Felipe R. Tuz Poot

105

significancia de 0.05 que el deterioro abrasivo del material 1 excede al del material 2 por ms de dos
unidades? Asuma que las poblaciones son aproximadamente normales con varianzas iguales.

Solucin
Si 1 y 2 representan las medias poblacionales de los deterioros abrasivos para el material 1 y 2
respectivamente, entonces se tienen las hiptesis siguientes:
0 : 1 2 = 2
: 1 2 > 2
Se trata de una prueba de hiptesis de una cola a la derecha con = 0.05 y = 12 + 10 2 = 20
grados de libertad. De la tabla de distribucin de student se obtiene el valor crtico de 1.725.
De la informacin del ejemplo se tiene que:
1 = 85
2 = 81

1 = 4
2 = 5

1 = 12
2 = 10

La medida estadstica de prueba es:


11(16) + 9(25)
=
= 4.478
12 + 10 2
=

(1 2 ) 0
1
1
+
1 2

(85 81) 2
1
1
4.47812 + 10

= 1.04

0.45

1.04 1.725

La medida estadstica de prueba 1.04 es menor que el valor crtico 1.725 por lo que cae en la regin
de aceptacin y se acepta la hiptesis nula.
Decisin: No se est en condiciones de concluir que el deterioro abrasivo del material 1 excede al del
material 2 por ms de dos unidades, la muestra no aporta evidencia para esta conclusin.
Ejemplo
Se deben eliminar gases cidos de otros gases de refinera en una instalacin de productos qumicos,
esto para reducir al mnimo la corrosin de las plantas. Dos mtodos para eliminar estos gases
produjeron el ritmo de corrosin (mm./ao), medidas que se representan a continuacin:
Mtodo A: 0.3, 0.7, 0.5, 0.8, 0.9, 0.7, 0.8
Mtodo B: 0.7, 0.8, 0.7, 0.6, 2.1, 0.6, 1.4, 2.3
Se puede concluir que el mtodo A tiene una media menor en el ritmo de corrosin que el mtodo
B? Justifique estadsticamente con un nivel de significancia de 0.1. Qu hiptesis se deben hacer para
comprobar la validez de la respuesta?
Prof. Felipe R. Tuz Poot

106

Solucin
Se desea probar la hiptesis:
0 : = : <
Equivalente a:
0 : = 0 : < 0
La informacin que se tiene es:
2 = 0.0424
2 = 0.4886

= 0.6714
= 1.15
2 =

= 7
= 8

( 1)2 + ( 1)2 (7 1)(0.0424) + (8 1)(0.4886)


=
= 0.2827
+ 2
7+82

Para poder utilizar el estadstico de prueba descrito previamente es necesario realizar los siguientes
supuestos:
Las muestras aleatorias provienen de poblaciones con distribucin normal y son
independientes.
Las poblaciones tienen desviaciones estndar iguales, o sea = .
Luego, el estadstico de prueba es:

(1 +

1 )(2 )

0.6714 1.15
(17 + 18)(0.2827)

= 1.7392

Como = 0.10, el valor crtico es , + 2 = 0.1,13 = 1.35. Como la estadstica de prueba es


tal que < 0.1,13 entonces se rechaza 0 , es decir, los datos presentan evidencia para concluir que
el mtodo A tiene una media en el ritmo de corrosin ms baja que el mtodo B.
Caso 2:
En este caso, los posibles planteamientos de las hiptesis con sus correspondientes estadsticas de
prueba y regiones de rechazo utilizando la distribucin t de student, se presentan en el siguiente
cuadro.
Hiptesis
nula

Hiptesis
alternativa

= 0

= 0

> 0

Medida Estadstica de
Prueba
( )
=
2 2
+

Regin de rechazo
|| > 2,
> ,

donde
2

= 0

< 0

Prof. Felipe R. Tuz Poot

2
2
( + )

< ,
2

(2 )2 (2 )
+
1
1

107

Ejemplo
Un fabricante de unidades reproductoras de video est probando el diseo de dos microcircuitos
para determinar si producen un flujo de corriente medio equivalente. El departamento de ingeniera
de desarrollo ha obtenido los siguientes datos:
Para el Diseo 1 = 15
Para el Diseo 2 = 10

= 24.2
= 23.9

2 = 10
2 = 20

Se desea determinar si hay alguna diferencia en el flujo de corriente medio entre los dos diseos,
donde se supone que las poblaciones tienen distribucin normal, pero no se desea suponer que las
varianzas son iguales. Utiliza un nivel de significancia de 0.1 para dar respuesta a esta hiptesis.
Solucin
La hiptesis de inters a probar es:
0 : =

Ya que se considera que los datos de las muestras provienen de distribuciones normales, adems las
varianzas son desconocidas y diferentes, el estadstico de prueba adecuado a emplear es:
=

( )
2 2
+

2
2
+
(
)

24.2 23.9
10 + 20
15 10

0.3
= 0.184
1.632993

10 20 2
( + )
7.111
=
= 152 10 2 =
= 14.93
2
0.032 + 0.444
10
20
(2 )2 (2 )
( )
( )
15 + 10
1 + 1
14
9
es decir = 15 pues el valor de se redondea al entero ms cercano.
El valor crtico es , = 0.05,15 = 1.753 y como el estadstico de prueba es tal que || < /2, se
2

concluye que no se rechaza 0 por lo que los datos no proporcionan evidencia suficiente para
concluir que existe diferencia entre las medias.
Una vez presentada la condicin i) se abordar a continuacin la condicin ii) que tiene las siguientes
caractersticas:
Las distribuciones poblacionales son desconocidas
Las desviaciones estndar y son desconocidas
Los tamaos de las muestras son mayores o iguales a 30 y,
Las muestras son independientes.
Como las desviaciones estndar son desconocidas se estiman con las desviaciones muestrales
por ser estos estimadores consistentes de sus desviaciones estndar poblacionales
respectivas. Por ello pueden ser tratadas como desviaciones estndar poblacionales conocidas, lo que
permite utilizar la estadstica de prueba y regiones de rechazo presentadas en la tabla siguiente:

Prof. Felipe R. Tuz Poot

108

Hiptesis
nula
H0

Hiptesis
alternativa

= 0

= 0

> 0

= 0

< 0

Medida Estadstica
de Prueba

Regin de rechazo

( ) 0

|| > 2

2 2
+

>
<

Esta tabla es exactamente la misma que la empleada en el caso cuando las muestras provienen de
distribuciones normales y sus desviaciones estndares son conocidas.

Prueba de hiptesis para la diferencia de proporciones


Intervalo de confianza para diferencia de proporciones poblacionales , con muestras
mayores o iguales a 30.
Cuando se tienen dos poblaciones en las cuales el inters radica en comparar las proporciones, al
igual que como se hizo con la diferencia de medias poblacionales, se realiza considerado un
estimador insesgado para la diferencia de proporciones 1 2 y este estimador es 1 2 , con

1 = 1 y 2 = 2 , donde 1 es el nmero de xitos obtenido del tamao de muestra 1 de una


1

poblacin con distribucin (1 ) y 2 es el nmero de xitos obtenido del tamao de


muestra 2 de una poblacin con distribucin (2 ).
En el siguiente cuadro se presentan los posibles planteamientos de las hiptesis nula y alterna, la
medida estadstica de prueba utilizando la distribucin normal estndar, as como, las regiones de
rechazo correspondientes.
Hiptesis
nula

Hiptesis
alternativa

1 2 = 0

1 2 0

1 2 = 0

1 2 > 0

1 2 = 0

1 2 < 0

Medida Estadstica
de Prueba
(1 2 ) 0
=
1
1
( + )
1 2
1 + 2
=
1 + 2
= 1

Regin de rechazo
|| > 2
>
<

Ejemplo
Considere un proceso de produccin que tiene una fraccin defectuosa 1 desconocida. A este
proceso se le realizan unas mejoras para reducir el porcentaje de defectuosos que est produciendo,
y queremos saber si estos cambios s reducen sustancialmente la proporcin de artculos defectuosos
del proceso. Para ello, se toma una muestra de 200 artculos del proceso original, y se encuentran 12
defectuosos, por otro lado se examinan 150 artculos del nuevo proceso y se observan 6 defectuosos.
Cree usted que los cambios efectuados al proceso han reducido el porcentaje de artculos
defectuosos? Use un nivel de confianza del 95%.
Solucin
Sean 1 y 2 proporciones poblacionales del proceso original y del nuevo respectivamente, entonces
se desea probar la hiptesis:
Prof. Felipe R. Tuz Poot

109

0 : 1 = 2 : 1 > 2
Los datos que se tienen son
1 = 12

2 = 6

1 = 200

2 = 150

por lo que las proporciones muestrales son


12

1 = 200 = 0.06 y 2 = 150 = 0.04


y adems
=

1 + 2
12 + 6
=
= 0.05143
1 + 2 200 + 150

Ya que las muestras son grandes el estadstico de prueba adecuado es:


=

1 2
1
1
( + )
1 2

0.06 0.04
(0.05143)(0.94857) ( 1 + 1 )
200 150

0.02
= 0.8382
0.02386

El valor crtico es = 0.05 = 1.64 y como el valor del estadstico es tal que < = 1.64 entonces
la hiptesis nula no puede ser rechazada, es decir, los datos no presentan evidencia para concluir que
los cambios efectuados al proceso ayudan a disminuir el porcentaje de defectuosos con una confianza
del 95%.

Prueba de hiptesis para el cociente de varianzas


Prueba de hiptesis para la igualdad de varianzas = , poblaciones con distribucin
normal.
Cuando nuestro objetivo es el de comparar las medias de dos poblaciones con distribucin normal,
el parmetro que se estudia es la diferencia de medias, ahora, si el objetivo es el de comparar las
variabilidad de las poblaciones, el parmetro que se estudia es el cociente de varianzas, 2 2 , la
justificacin es que en distribuciones muestrales se comprueba que el estadstico

2 2
2 2

tiene una

distribucin 1, 1 ( tamao de muestra de y tamao de muestra de ); en particular si


2 = 2 o bien

2
2

= 1, entonces = 2 tiene la misma distribucin de Fisher. En cambio no hay tal

justificacin si se usa diferencia de varianzas.


En el siguiente cuadro se presentan los posibles planteamientos de las hiptesis con sus
correspondientes estadsticas de prueba y regiones de rechazo utilizando la distribucin de Fisher.

Prof. Felipe R. Tuz Poot

110

Hiptesis
nula

Hiptesis
alternativa

12 = 22

12

22

12 = 22

12 > 22

12

12

22

<

22

Medida Estadstica
de Prueba
12
= 2
2
con 1 = 1 1
grados de libertad en
el numerador y 2 =
2 1 grados de
libertad en el
denominador.

Regin de rechazo
1

<

2,(2 ,1 )

> 2,(1 ,2 )
> ,(1 ,2 )
<

1
,(2 ,1 )

La notacin (1 , 2 ) indica que se debe considerar el valor crtico de la tabla F-Fisher con 1 grados
de libertad en el numerador, 2 grados de libertad en el denominador y con un nivel de significancia
.
En las siguientes grficas se presentan los diferentes casos de pruebas de hiptesis de una cola y de
dos colas, as como las frmulas para calcular los valores crticos; tambin se muestran las regiones
de rechazo identificadas como la parte sombreada. En el caso de pruebas de hiptesis de una cola, ya
sea a la izquierda o a la derecha, el nivel de significancia es el valor de mientras que cuando la
prueba de hiptesis es de dos colas el nivel de significancia es /2.

a
f

Regin de rechazo para la prueba de hiptesis cuando : 12 < 22

Regin de rechazo para la prueba de hiptesis cuando : 12 > 22

Prof. Felipe R. Tuz Poot

111

Regin de rechazo para la prueba de hiptesis cuando : 12 22

Ejemplo
Un mdico asegura que la variabilidad entre el peso de las nias () y los nios () es diferente. Para
comprobar estadsticamente dicha afirmacin se realiza el experimento de seleccionar dos muestras,
una de 10 nias y otra de 8 nios, de los cuales se tuvieron varianzas de 2 = 2.1 y 2 = 3.21,
respectivamente. Presentan las varianzas muestrales suficiente evidencia que indique que la
afirmacin del mdico es cierta? Compruebe con un nivel de significancia de 0.1
Solucin
Se desea probar la hiptesis
0 : 2 = 2 : 2 2
Supngase que las poblaciones tienen distribuciones que son razonablemente monticulares y que
por lo tanto satisfacen la suposicin de que las poblaciones son normales, dado esto el siguiente
proceso es vlido, estadsticamente.
El estadstico de prueba es
=

2
2.1
=
= 0.6542
2
3.21

Se sabe que la regin de rechazo es para cualquier valor que cumple cualquiera de los siguientes
casos: > ,
2

1, 1

< (,
2

1,

1 ) .

Se tiene que:
,

1, 1

= 0.05,9,7 = 3.68
1

(,
2

1,

1 )

= (0.05,7,9 )

= (3.29)1 = 0.3039.

Como el estadstico f no cumple con ninguna de las condiciones entonces no pertenece a la regin de
rechazo. Como consecuencia no hay suficiente evidencia para concluir que la variacin en pesos entre
los nios difiera con respecto a la variacin en el peso entre las nias con 90% de confianza. Los datos
no apoyan a la hiptesis que plantea el mdico.

Prof. Felipe R. Tuz Poot

112