Está en la página 1de 42

16.

PRUEBAS DE HIPTESIS
CONCEPTOS BSICOS PARA EL PROCEDIMIENTO
Etapas bsicas en pruebas de hiptesis. Al realizar pruebas de hiptesis, se parte de
un valor supuesto (Hipottico) en parmetro poblacional. Despus de recolectar una
muestra aleatoria, se compara la estadstica muestral, as como la media, con el
parmetro hipottico, se compara con una supuesta media poblacional. Despus se
acepta o se rechaza el valor hipottico, segn proceda. Se rechaza el valor hipottico
slo si el resultado muestral resulta muy poco probable cuando la hiptesis es cierta.
- Etapa 1. Planear la hiptesis nula y la hiptesis alternativa. La hiptesis nula (H 0)
es el valor hipottico del parmetro que se compra con el resultado muestral
resulta muy poco probable cuando la hiptesis es cierta.
- Etapa 2. Especificar el nivel de significancia que se va a utilizar. El nivel de
significancia del 5%, entonces se rechaza la hiptesis nula solamente si el
resultado muestral es tan diferente del valor hipottico que una diferencia de esa
magnitud o mayor, pudiera ocurrir aleatoria mente con una probabilidad de 1.05 o
menos.
- Etapa 3. Elegir la estadstica de prueba. La estadstica de prueba puede ser la
estadstica muestral (el estimador no segado del parmetro que se prueba) o una
versin transformada de esa estadstica muestral. Por ejemplo, para probar el valor
hipottico de una media poblacional, se toma la media de una muestra aleatoria de
esa distribucin normal, entonces es comn que se transforme la media en un valor
z el cual, a su vez, sirve como estadstica de prueba.
Consecuencias de las Decisiones en Pruebas de Hiptesis.
Decisiones Posibles

Situaciones Posibles
La hiptesis nula es La hiptesis nula es falsa
verdadera
Aceptar la Hiptesis Nula Se acepta correctamente
Error tipo II o Beta
Rechazar la Hiptesis Error tipo I o Alfa
Se rechaza correctamente
Nula
- Etapa 4. Establecer el valor o valores crticos de la estadstica de prueba.
Habiendo especificado la hiptesis nula, el nivel de significancia y la estadstica
de prueba que se van a utilizar, se produce a establecer el o los valores crticos de

estadstica de prueba. Puede haber uno o ms de esos valores, dependiendo de si se


va a realizar una prueba de uno o dos extremos.
- Etapa 5. Determinar el valor real de la estadstica de prueba. Por ejemplo, al
probar un valor hipottico de la media poblacional, se toma una muestra aleatoria
y se determina el valor de la media muestral. Si el valor crtico que se establece es
un valor de z, entonces se transforma la media muestral en un valor de z.
- Etapa 6. Tomar la decisin. Se compara el valor observado de la estadstica
muestral con el valor (o valores) crticos de la estadstica de prueba. Despus se
acepta o se rechaza la hiptesis nula. Si se rechaza sta, se acepta la alternativa; a
su vez, esta decisin tendr efecto sobre otras decisiones de los administradores
operativos, como por ejemplo, mantener o no un estndar de desempeo o cul de
dos estrategias de mercadotecnia utilizar.
La distribucin apropiada de la prueba estadstica se divide en dos regiones: una
regin de rechazo y una de no rechazo. Si la prueba estadstica cae en esta ltima
regin no se puede rechazar la hiptesis nula y se llega a la conclusin de que el
proceso funciona correctamente.
Al tomar la decisin con respecto a la hiptesis nula, se debe determinar el valor
crtico en la distribucin estadstica que divide la regin del rechazo (en la cual la
hiptesis nula no se puede rechazar) de la regin de rechazo. A hora bien el valor
crtico depende del tamao de la regin de rechazo.
Pasos de la Prueba de Hiptesis
- Expresar la hiptesis nula
- Expresar la hiptesis alternativa
- Especificar el nivel de significanca
- Determinar el tamao de la muestra
- Establecer los valores crticos que establecen las regiones de rechazo de las de no
rechazo.
- Determinar la prueba estadstica.
- Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica
apropiada.
- Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no
rechazo.
- Determinar la decisin estadstica.
- Expresar la decisin estadstica en trminos del problema.
Hiptesis Estadstica. Al intentar alcanzar una decisin, es til hacer hiptesis (o
conjeturas) sobre la poblacin aplicada. Tales hiptesis, que pueden ser o no ciertas,

se llaman hiptesis estadsticas. Son, en general, enunciados acerca de las


distribuciones de probabilidad de las poblaciones.
Hiptesis Nula. En muchos casos formulamos una hiptesis estadstica con el nico
propsito de rechazarla o invalidarla. As, si queremos decidir si una moneda est
trucada, formulamos la hiptesis de que la moneda es buena (o sea p=0,5, donde p es
la probabilidad de cara). Analgicamente, si deseamos decidir si un procedimiento es
mejor que otro, formulamos la hiptesis de que no hay diferencia entre ellos (o sea.
Que cualquier diferencia observada se debe simplemente a fluctuaciones en el
muestreo de la misma poblacin). Tales hiptesis se suelen llamar hiptesis nula y se
denotan por Ho.
Para todo tipo de investigacin en la que tenemos dos o ms grupos, se establecer
una hiptesis nula. La hiptesis nula es aquella que nos dice que no existen
diferencias significativas entre los grupos. Por ejemplo, supongamos que un
investigador cree que si un grupo de jvenes se somete a un entrenamiento intensivo
de natacin, stos sern mejores nadadores que aquellos que no recibieron
entrenamiento. Para demostrar su hiptesis toma al azar una muestra de jvenes, y
tambin al azar los distribuye en dos grupos: uno que llamaremos experimental, el
cual recibir entrenamiento, y otro que no recibir entrenamiento alguno, al que
llamaremos control. La hiptesis nula sealar que no hay diferencia en el desempeo
de la natacin entre el grupo de jvenes que recibi el entrenamiento y el que no lo
recibi.
Una hiptesis nula es importante por varias razones:
-

Es una hiptesis que se acepta o se rechaza segn el resultado de la investigacin.


El hecho de contar con una hiptesis nula ayuda a determinar si existe una
diferencia entre los grupos, si esta diferencia es significativa, y si no se debi al
azar.
- No toda investigacin precisa de formular hiptesis nula. Se recomienda que la
hiptesis nula es aquella por la cual indicamos que la informacin a obtener es
contraria a la hiptesis de trabajo.
Al formular esta hiptesis, se pretende negar la variable independiente. Es decir, se
enuncia que la causa determinada como origen del problema flucta, por tanto, debe
rechazarse como tal.
Hiptesis Alternativa: Toda hiptesis que difiere de una dada se llamar una
hiptesis alternativa. Una hiptesis alternativa a la hiptesis nula se denotar por H1.
Al responder a un problema, es muy conveniente proponer otras hiptesis en que
aparezcan variables independientes distintas de las primeras que formulamos. Por

tanto, para no perder tiempo en bsquedas intiles, es necesario hallar diferentes


hiptesis alternativas como respuesta a un mismo problema y elegir entre ellas cules
y en qu orden vamos a tratar su comprobacin.
Las hiptesis, naturalmente, sern diferentes segn el tipo de investigacin que se
est realizando. En los estudios exploratorios, a veces, el objetivo de la investigacin
podr ser simplemente el de obtener los mnimos conocimientos que permitan
formular una hiptesis. Tambin es aceptable que, en este caso, resulten poco
precisas, como cuando afirmamos que "existe algn tipo de problema social en tal
grupo", o que los planetas poseen algn tipo de atmsfera, sin especificar de qu
elementos est compuesto.
Los trabajos de ndole descriptiva generalmente presentan hiptesis del tipo "todos
los X poseen, en alguna medida, las caracterstica Y". Por ejemplo, podemos decir
que todas las naciones poseen algn comercio internacional, y dedicarnos a describir,
cuantificando, las relaciones comerciales entre ellas. Tambin podemos hacer
afirmaciones del tipo "X pertenece al tipo Y", como cuando decimos que una
tecnologa es capital - intensiva. En estos casos, describimos, clasificndolo, el objeto
de nuestro inters, incluyndolo en un tipo ideal complejo de orden superior.
Por ltimo, podemos construir hiptesis del tipo "X produce (o afecta) a Y", donde
estaremos en presencia de una relacin entre variables.
Errores de tipo I y de tipo II. Si rechazamos una hiptesis cuando debiera ser
aceptada, diremos que se ha cometido un error de tipo I. Por otra parte, si aceptamos
una hiptesis que debiera ser rechazada, diremos que se cometi un error de tipo II.
En ambos casos, se ha producido un juicio errneo. Para que las reglas de decisin (o
no contraste de hiptesis) sean buenos, deben disearse de modo que minimicen los
errores de la decisin; y no es una cuestin sencilla, porque para cualquier tamao de
la muestra, un intento de disminuir un tipo de error suele ir acompaado de un
crecimiento del otro tipo. En la prctica, un tipo de error puede ser ms grave que el
otro, y debe alcanzarse un compromiso que disminuya el error ms grave. La nica
forma de disminuir ambos a la vez es aumentar el tamao de la muestra que no
siempre es posible.
Niveles de Significacin. Al contrastar una cierta hiptesis, la mxima probabilidad
con la que estamos dispuesto a correr el riesgo de cometern error de tipo I, se llama
nivel de significacin. Esta probabilidad, denota a menudo por se, suele especificar
antes de tomar la muestra, de manera que los resultados obtenidos no influyan en
nuestra eleccin.

En la prctica, es frecuente un nivel de significacin de 0,05 0,01, si bien se une


otros valores. Si por ejemplo se escoge el nivel de significacin 0,05 ( 5%) al
disear una regla de decisin, entonces hay unas cinco (05) oportunidades entre 100
de rechazar la hiptesis cuando debiera haberse aceptado; Es decir, tenemos un 95%
de confianza de que hemos adoptado la decisin correcta. En tal caso decimos que la
hiptesis ha sido rechazada al nivel de significacin 0,05, lo cual quiere decir que tal
hiptesis tiene una probabilidad 0,05 de ser falsa.
Prueba de 1 o 2 Extremos. Cuando estudiamos ambos valores estadsticos es decir,
ambos lados de la media lo llamamos prueba de uno y dos extremos o contraste de
una y dos colas. Con frecuencia no obstante, estaremos interesados tan slo en
valores extremos a un lado de la media (o sea, en uno de los extremos de la
distribucin), tal como sucede cuando se contrasta la hiptesis de que un proceso es
mejor que otro (lo cual no es lo mismo que contrastar si un proceso es mejor o peor
que el otro) tales contrastes se llaman unilaterales, o de un extremo. En tales
situaciones, la regin crtica es una regin situada a un lado de la distribucin, con
rea igual al nivel de significacin.
Curva Caracterstica Operativa y Curva de Potencia. Podemos limitar un error
de tipo I eligiendo adecuadamente el nivel de significancia. Es posible evitar el riesgo
de cometer el error tipo II simplemente no aceptando nunca la hiptesis, pero en
muchas aplicaciones prcticas esto es inviable. En tales casos, se suele recurrir a
curvas caractersticas de operacin o curvas de potencia que son grficos que
muestran las probabilidades de error de tipo II bajo diversas hiptesis. Proporcionan
indicaciones de hasta que punto un test dado nos permitir evitar un error de tipo II;
es decir, nos indicarn la potencia de un test a la hora de prevenir decisiones errneas.
Son tiles en el diseo de experimentos por que sugieren entre otras cosas el tamao
de muestra a manejar.
Inferencias acerca de la Media Poblacional (varianza conocida). Supongamos que
de una poblacin normal con media desconocida . y varianza conocida 2 se extrae
una muestra de tamao n, entonces de la distribucin de la media muestral x se
obtiene que:
Z

x o
/ n

Se distribuye como una normal estndar. Luego, P Z / 2 Z Z / 2 1

Donde Z/2 es un valor de la normal estndar tal que el rea a la derecha de dicho
valor es /2, como se muestra en la figura
Sustituyendo la frmula de z se obtiene:
x

P Z / 2
Z / 2 1

/
n

Haciendo un despeje algebraico, se obtiene


Z
Z

P / 2
x /2
1
n
n

De lo anterior se puede concluir que un Intervalo de Confianza del 100(1-)% para la


media poblacional , es de la forma:
Z
Z

,x /2
x /2

n
n

Usualmente =0.1, 0.05 0.01, que corresponden a intervalos de confianza del 90,
95 y 99 por ciento respectivamente. La siguiente tabla muestra los Z/2 ms usados.
Nivel de Confianza
90
95
99

Z/2
1.645
1.96
2.58

En la prctica si la media poblacional es desconocida entonces, es bien probable que


la varianza tambin lo sea puesto que en el clculo de 2 interviene . Si sta es la
situacin, y si el tamao de muestra es grande (n>30, parece ser lo ms usado),
entonces 2 es estimada por la varianza muestral s2 y se puede usar la siguiente
frmula para el intervalo de confianza de la media poblacional:

Z / 2 s

,x

Z / 2 s
n

Por otro lado, tambin se pueden hacer pruebas de hiptesis con respecto a la media
poblacional . Por conveniencia, en la hiptesis nula siempre se asume que la media
es igual a un valor dado. La hiptesis alterna en cambio, puede ser de un slo lado:
menor mayor que el nmero dado, de dos lados: distinto a un nmero dado.
Existen dos mtodos de hacer la prueba de hiptesis: el mtodo clsico y el mtodo
del P-Value.
a. En el mtodo clsico, se evala la prueba estadstica de Z y al valor obtenido se le
llama Z calculado (Zcalc). Por otro lado el nivel de significacin dado determina
una regin de rechazo y una de aceptacin. Si Z calc cae en la regin de rechazo,
entonces se concluye que hay suficiente evidencia estadstica para rechazar la
hiptesis nula con base en los resultados de la muestra tomada. Las frmulas
estn resumidas en la siguiente tabla:
Caso I
Ho: =0
Ha: <0

Caso II
Ho : =0
Ha : 0

Prueba Estadstica: Z

x o

Caso III
Ho : =0
Ha : >0

/ n

Aqu Z es el valor de la normal estndar tal que el rea a la derecha de dicho


valor es . Recordar tambin que puede ser sustituido por s, cuando la muestra
es relativamente grande (n>30). Los valores de ms usados son 0.01 y 0.05. Si
se rechaza la hiptesis nula al .01 se dice que la hiptesis alterna es altamente
significativa y al .05 que es significativa.
b. Trabajar slo con esos dos valores de simplificaba mucho el aspecto
computacional, pero por otro lado creaba restricciones. En la manera moderna de
probar hiptesis se usa una cantidad llamada P-Value. El P-Value llamado el
nivel de significacin observado, es el valor de al cual se rechazara la hiptesis
nula si se usa el valor calculado de la prueba estadstica. En la prctica un PValue cercano a 0 indica un rechazo de la hiptesis nula. As un P-Value menor
que .05 indicar que se rechaza la prueba estadstica.
-

Frmulas para calcular P-Value:


Si Ho: >o, entonces P-value = 1*Prob(Z>Zcalc).

Si Ho: <o, entonces P-value = 1*Prob(Z<Zcalc).


Si Ho: o, entonces P-value = 2*Prob(Z>|Zcalc|).
Los principales programas estadsticos dan los P-Value para la mayora de las
pruebas estadsticas. A travs de todo el texto usamos el mtodo del P-Value para
probar hiptesis.

Concepto. Afirmacin acerca de los parmetros de la poblacin.


PRUEBAS DE HIPTESIS PARA LA MEDIA Y PROPORCIONES
Debido a la dificultad de explicar este tema se enfocar un problema basado en un
estudio en una fbrica de llantas. En este problema la fbrica de llantas tiene dos
turnos de operarios, turno de da y turno mixto. Se selecciona una muestra aleatoria
de 100 llantas producidas por cada turno para ayudar al gerente a sacar conclusiones
de cada una de las siguientes preguntas
- Es la duracin promedio de las llantas producidas en el turno de da igual a 25
000 millas?
- Es la duracin promedio de las llantas producidas en el turno mixto menor de 25
000 millas?
- Se revienta ms de un 8% de las llantas producidas por el turno de da antes de
las 10 000 millas?
Prueba de Hiptesis para la media. En la fbrica de llantas la hiptesis nula y
alternativa para el problema se plantearon como,
Ho: = 25 000
H1: 25 000
Si se considera la desviacin estndar las llantas producidas en el turno de da,
entonces, con base en el teorema de limite central, la distribucin en el muestreo de la
media seguira la distribucin normal, y la prueba estadstica que esta basada en la
diferencia entre la media X de la muestra y la media hipottica se encontrara como
Z

x o
/ n

Si el tamao de la regin de rechazo se estableciera en 5% entonces se podran


determinar los valores crticos de la distribucin. Dado que la regin de rechazo esta
dividida en las dos colas de la distribucin, el 5% se divide en dos partes iguales de
2.5%.
Dado que ya se tiene la distribucin normal, los valores crticos se pueden expresar
en unidades de desviacin. Una regin de rechazo de 0.25 en cada cola de la

distribucin normal, da por resultado un rea de .475 entre la media hipottica y el


valor crtico. Si se busca est rea en la distribucin normal, se encuentra que los
valores crticos que dividen las regiones de rechazo y no rechazo son + 1.96 y - 1.96

Por tanto, la regla para decisin sera rechazar Ho si Z > +1.96 o s z < -1.96, de lo
contrario, no rechazar Ho. No obstante, en la mayor parte de los casos se desconoce la
desviacin estndar de la poblacin. La desviacin estndar se estima al calcular
S, la desviacin estndar de la muestra. Si se supone que la poblacin es normal la
distribucin en el muestreo de la media seguira una distribucin t con n-1 grados de
libertad.
En la prctica, se a encontrado que siempre y cuando el tamao de la muestra no sea
muy pequeo y la poblacin no este muy sesgada, la distribucin t da una buena
aproximacin a la distribucin de muestra de la media. La prueba estadstica para
determinar la diferencia entre la media x de la muestra y la media de la
poblacin cuando se utiliza la desviacin estndar S de la muestra, se expresa
t n 1

X
s/

Para una muestra de 100, si se selecciona un nivel de significanca de 0.05, los


valores crticos de la distribucin t con 100-1= 99 grados de libertad se puede obtener
como se indica en la siguiente tabla tenemos el valor de 1.9842. Como esta prueba de
dos colas, la regin de rechazo de 0.05 se vuelve a dividir en dos partes iguales de
0.025 cada una. Con el uso de las tablas para t, los valores crticos son 1.984 y
+1.984. La regla para la decisin es,
Rechazar Ho si t 99 1.9842 o t 99 1.9842 de lo contrario, no rechazar Ho
Los resultados de la muestra para el turno de da (en millas) fueron

X da 25.430, Sda 4.000

n da 100

millas. Puesto que se esta probando si

la media es diferente a 25 000 millas, se tiene con la ecuacin

t n 1

X
S/ n

t 1001

25.430 25.00
1.075
4.000 / 100

Dado que t100-1=1.075, se ve que -1.984 < +1.075 < + 1.984, entonces no se rechaza
Ho.
Por ello, la decisin de no rechazar la hiptesis nula Ho. En conclusin es que la
duracin promedio de las llantas es 25 000 millas. A fin de tener en cuenta la
posibilidad de un error de tipo II, este enunciado se puede redactar como no hay
pruebas de que la duracin promedio de las llantas sea diferente a 25 000 millas en
las llantas producidas en el turno de da.
PRUEBA DE HIPTESIS PARA PROPORCIONES
El concepto de prueba de hiptesis se puede utilizar para probar hiptesis en relacin
con datos cualitativos. Por ejemplo, en el problema anterior el gerente de la fbrica de
llantas quera determinar la proporcin de llantas que se reventaban antes de 10.000
millas. Este es un ejemplo de una variable cualitativa, dado que se desea llegar a
conclusiones en cuanto a la proporcin de los valores que tienen una caracterstica
particular.
El gerente de la fbrica de llantas quiere que la calidad de llantas producidas, sea lo
bastante alta para que muy pocas se revienten antes de las 10.000 millas. Si ms de un
8% de las llantas se revientan antes de las 10.000 millas, se llegara a concluir que el
proceso no funciona correctamente. La hiptesis nula y alternativa se pueden expresar
como sigue:
H 0 P 0.08
(Funciona correctamente)
H1 P 0.08
(No funciona correctamente)
La prueba estadstica se puede expresar en trminos de la proporcin de xitos como
sigue:
P P
X
Z s
Ps
n
Pq
n
siendo X y N el nmero de xitos de la muestra y n el tamao de la muestra, P la
proporcin de xitos de la hiptesis nula. Ahora se determinar si el proceso funciona
correctamente para las llantas producidas para el turno de da. Los resultados del
turno de da indican que cinco llantas en una muestra de 100 se reventaron antes de
10,000 millas para este problema, si se selecciona un nivel de significancia 0.05
, las regiones de rechazo y no rechazo se estableceran como a continuacin se

10

muestra. Y la regla de decisin sera: Rechazar Ho si z> + 1.645; de lo contrario no


rechazar Ho. Con los datos que se tienen,
P P
Ps 0.05 Z s
1.107
Pq
n
una vez reemplazado, recuerde p+q=1
Z=-1.107 +1.645; por tanto no rechazar Ho.
La hiptesis nula no se rechazara por que la prueba estadstica no ha cado en la
regin de rechazo. Se llegara a la conclusin de que no hay pruebas de que ms del
8% de las llantas producidas en el turno de da se revienten antes de 10,000 millas. El
gerente no ha encontrado ninguna prueba de que ocurra un nmero excesivo de
reventones en las llantas producidas en el turno de da.
Una hiptesis estadstica es una suposicin hecha con respecto a la funcin de
distribucin de una variable aleatoria. Para establecer la verdad o falsedad de una
hiptesis estadstica con certeza total, ser necesario examinar toda la poblacin. En
la mayora de las situaciones reales no es posible o practico efectuar este examen, y el
camino mas aconsejable es tomar una muestra aleatoria de la poblacin y en base a
ella, decidir si la hiptesis es verdadera o falsa.
En la prueba de una hiptesis estadstica, es costumbre declarar la hiptesis como
verdadera si la probabilidad calculada excede el valor tabular llamado el nivel de
significacin y se declara falsa si la probabilidad calculada es menor que el valor
tabular. La prueba a realizar depender del tamao de las muestras, de la
homogeneidad de las varianzas y de la dependencia o no de las variables. Si las
muestras a probar involucran a ms de 30 observaciones, se aplicar la prueba de Z, si
las muestras a evaluar involucran un nmero de observaciones menor o igual que 30
se emplea la prueba de t de student. La frmula de clculo depende de si las varianzas
son homogneas o heterogneas, si el nmero de observaciones es igual o diferente, o
si son variables dependientes.
Para determinar la homogeneidad de las varianzas se toma la varianza mayor y se
divide por la menor, este resultado es un estimado de la F de Fisher. Luego se busca
en la tabla de F usando como numerador los grados de libertad (n-1) de la varianza
mayor y como denominador (n-1) de la varianza menor para encontrar la F de Fisher
tabular. Si la F estimada es menor que la F tabular se declara que las varianzas son
homogneas. Si por el contrario, se declaran las varianzas heterogneas. Cuando son
variables dependientes (el valor de una depende del valor de la otra), se emplea la
tcnica de pruebas pareadas.

11

Como en general estas pruebas se aplican a dos muestras, se denominarn a y b para


referirse a ellas, as entenderemos por:
- na al nmero de elementos de la muestra a
- nb al nmero de elementos de la muestra b
- xb al promedio de la muestra b
- s2a la varianza de la muestra a
- Y as sucesivamente
Entonces se pueden distinguir 6 casos a saber:
- Caso de muestras grandes (n>30)
- Caso de na = nb y s2a = s2b
- Caso de na = nb y s2a s2b
- Caso de na nb y s2a = s2b
- Caso de na nb y s2a s2b
- Caso de variables dependientes

1.-Cuando las muestras a probar involucran 2.-Caso


observaciones y a ms de 30 observaciones
zc

aX bX
2

as bs

na nb

tc

de

nmero
igual
de
varianzas homogneas

aX b X
2

as 2 bs 2
(2 / n )

3.-Caso de igual nmero de observaciones


4.-Caso de diferente nmero de
observacioy varianzas heterogneas.
nes y varianzas homogneas
tc

aX b X
as bs
n
2

tc

aX bX
cs 2 cs 2

an bn

5.- Caso de diferente nmero de observaciones y varianzas heterogneas. En este


caso, la tc es comparada con la tg (t generada), que a diferencia de los casos anteriores,
hay que calcularla.

12

s a2
ta
n
t g 2a
sa
na

s 2b
tb
nb
2
s
b
nn

tc

Xa Xb
s a2 s 2b

na nn

Donde: ta y tb son los valores de la tabla con n-1 grados de libertad para a y b
respectivamente
6.- Caso de muestras pareadas (de variables dependientes). En este caso, se asume
que las muestras han sido distribuidas por pares.
D
n
tc
(D D)2 n
n 1
TEST DE HIPTESIS ESTADSTICA
En la seccin anterior tratamos la estimacin y precisin de los estimadores, que
conforman una de las dos reas principales de la Inferencia estadstica. En esta
seccin presentaremos una forma diferente de obtener inferencia acerca de
parmetros poblacionales, probando hiptesis respecto a sus valores. Un test de
hiptesis es una metodologa o procedimiento que permite cuantificar la probabilidad
del error que se cometera cuando se hace una afirmacin sobre la poblacin bajo
estudio, es decir, nos permite medir la fuerza de la evidencia que tienen los datos a
favor o en contra de alguna hiptesis de inters sobre la poblacin.
Ejemplo. Una industria usa como uno de los componentes de las mquinas de
produccin una lmpara especial importada que debe satisfacer algunas exigencias.
Una de esas exigencias est relacionada a su vida til en horas. Esas lmparas son
fabricadas por dos pases y las especificaciones tcnicas varan de pas a pas. Por
ejemplo el catlogo del producto americano afirma que la vida til media de sus
lmparas es de 15500 horas, con un SD de 1200. Mientras que para el producto
europeo la media es de 16500, y el SD es de 2000.
Un lote de esas lmparas de origen desconocido es ofrecido a un precio muy
conveniente. Para que la industria sepa si hace o no una oferta ella necesita saber cual
es el pas que produjo tales lmparas. El comercio que ofrece tales lmparas afirma
que ser divulgada la vida til media de una muestra de 25 lmparas del lote antes de
la oferta. Que regla de decisin deben usar los responsables de la industria para decir

13

que las lmparas son de procedencia americana o europea?. Una respuesta que surge
inmediatamente es la de considerar como pas productor aquel en la cual la media de
la muestra se aproxima ms a la media de la poblacin. As, la decisin sera si
x 16000 (el punto medio entre 15500 y 16500) diremos que es de procedencia
americana; en caso contrario diremos que es de procedencia europea.
Suponga que en el da de la licitacin se inform que, de acuerdo con la regla de
decisin diramos que las lmparas son de origen americano. Podemos estar
herrados en esa conclusin?. O en otras palabras, es posible que una muestra de 25
lmparas de origen europeo presente una media de 15800? Si, es posible. Entonces,
para un mejor entendimiento de la regla de decisin adoptada, es interesante estudiar
los tipos de errores que podemos cometer y las respectivas probabilidades de cometer
esos errores.
Los tests de hiptesis consisten en confrontar dos hiptesis, una llamada hiptesis
nula que denotamos con Ho y otra llamada hiptesis alternativa denotada con H1.
En el ejemplo las hiptesis que se plantean son:
En el ejemplo las hiptesis consideradas son
Ho Las lmparas son de origen europeo, esto equivale a decir que la vida til X de
cada lmpara sigue una distribucin con media =16500 horas y un SD=2000 horas.
H1; Las lmparas son de origen americano, es decir la media poblacional = 15500
horas con un SD=1200 horas.
Bajo este planteo un test de hiptesis estadstica no es otra cosa que un
procedimiento para tomar una decisin, bajo incertidumbre, sobre la validez de
la hiptesis nula usando la evidencia de los datos. Puesto que trabajamos bajo
incertidumbre es claro que cualquiera sea la decisin que tomemos siempre existe una
probabilidad de cometer error. A fin de clarificar esto podemos presentar el siguiente
esquema:
Esquema del procedimiento
Decisin
Realidad sobre Ho
Cierta
Rechazar Ho
Error Tipo I
No rechazar Ho
Decisin correcta

Falsa
Decisin correcta
Error Tipo II

Como se puede ver en el esquema, con cada tipo de decisin que se tome hay
asociado una posibilidad de cometer un error. Un procedimiento de este tipo sera
ptimo cuando las probabilidades de cometer un error, cualquiera sea la decisin que
se adopte, sean pequeas. Lamentablemente, en la mayora de los tests de hiptesis
slo es posible controlar una de ellas, con la circunstancia agravante de que estos

14

errores son competitivos, es decir, cuando se disminuye mucho la probabilidad de uno


aumenta la probabilidad del otro.
Puesto que, el inters generalmente es rechazar H o la probabilidad de error que se
controla durante este procedimiento, es justamente el error asociado a esta decisin
(Probabilidad del Error Tipo I), es decir, la probabilidad de rechazar Ho cuando es
cierta. La mxima probabilidad de error tipo I se denota con y recibe el nombre de
nivel de significacin del test y l debe ser prefijado de antemano. La probabilidad
de Error Tipo II se denota con y es til para encontrar la bondad del test que se
mide en trminos de la cantidad 1- denominada Poder del Test.
El nivel de significacin que se usa generalmente es =0.05 lo que corresponde a un
5% en trmino de porcentaje.
Retomando el ejemplo vamos a indicar por RC una regin determinada por los
valores de X menores que 16000, es decir RC={X 16000}. El valor 16000 se
denomina punto crtico y se denotar como xc.

Con las notaciones indicadas arriba, la probabilidad de cometer cada uno de los
errores puede ser escrito del siguiente modo:
- P[Error Tipo I] = P[ X pertenezca a RC | H0 es verdadera] = .
- P[Error Tipo II] = P[ X no pertenezca a RC | H0 es falsa ] =
Ejemplo. En el ejemplo anterior, cuando H 0 es verdadera, es decir, las lmparas son
de origen europea, sabemos del teorema central del lmite que x , o sea la media de
las muestras de tamao 25, tendrn distribucin aproximadamente normal con media
16500 y =

2000
400 , es decir X N(16500, 1600). Entonces,
25

P[Error Tipo I] = P[ X RC | H0 es verdadera] =


= P[ X 16000 | X N(16500, 1600)] = P[ Z (16000 16500)/
400]
= P[ Z -1.25] = 0.106 = 10.6%.
Para cada regla de decisin adoptada, es decir, para cada valor crtico x c se obtiene un
valor de probabilidad de error tipo 1. Por otra parte, si x c se elige menor que 15000
disminuye pero aumenta.

15

Sin embargo, se puede proceder de manera inversa, es decir, fijado encontramos la


regla de decisin que corresponder a una probabilidad de error 1 igual a .
Ejemplo. Si se toma = 5%, y se procede a encontrar la regla de decisin
correspondiente:
5%= P[Error Tipo I]= P[ X xc | X N(16500, 1600)] = P[Z < -1.645],
pero se sabe que, para una distribucin normal estndar
x 16500
1.645 c
400
de donde xc = 15842 horas. Entonces, la regla de decisin ser
Si X fuera inferior a 15842 se dice que el lote es americano, en caso contrario se
dice que es europeo.
Con esta regla la probabilidad de error tipo II ser
P[Error Tipo II] = P[ X > 15842 | X N(16500, 1600)] = P[Z > 1.425] = 7.93%
Procedimiento general de un test de hiptesis basado en la regin de rechazo. Se
da ahora una secuencia de pasos que puede ser usada sistemticamente para cualquier
test de hiptesis.
- Iniciar el procedimiento estableciendo, de manera clara y explcita, cul es la
hiptesis nula, es decir, H0.
- Usar la teora estadstica para construir un indicador de concordancia entre los
datos y la hiptesis nula. Este indicador denominado estadstico del test ser
usado para juzgar la hiptesis H0.
- Fijar el nivel de significacin deseado , que es el mximo error aceptable cuando
se rechaza H0, y usar este valor para construir la regin crtica.
- Calcular el valor del estadstico a partir de la muestra.
- Si el valor del estadstico pertenece a la regin crtica, entonces rechazar H0. En
caso contrario, lo que se puede afirmar es que no hay suficiente evidencia para
rechazar H0.
- Si se dispone de una hiptesis alternativa y de la distribucin del estadstico del
test bajo la suposicin que vale la hiptesis alternativa, se puede calcular la
probabilidad de error Tipo II.
Procedimiento general de un test de hiptesis basado en el P-value. Otro
procedimiento general de un test de hiptesis ms usado en la actualidad debido a la
disponibilidad de paquetes de programas estadsticos, consiste en tomar la decisin a
partir de la probabilidad del error Tipo I que brindan las salidas de tales paquetes de
programas, denominado P-value o simplemente P. Este procedimiento lo podemos
resumir en los siguientes pasos:
- Suponer que Ho es cierta.

16

- Para confrontar esta suposicin con la informacin (parcial) que proveen los datos
sobre la realidad de Ho, se forma una especie de indicador de concordancia,
denominado estadstico del test, el cual es funcin del de los datos.
- Como el estadstico depende de la informacin de los datos, con cada muestra
posible hay asociado un valor de este estadstico y en consecuencia se genera una
nueva variable aleatoria. Asociada a esta variable hay una cierta distribucin de
probabilidad, a partir de la cual se determina la probabilidad de que la informacin
de los datos concuerde con la hiptesis nula, denominado P-Value. De esta
manera, el P-Value representara la probabilidad de cometer un error cuando se
toma la decisin de rechazar Ho.
- Es claro que si de antemano se fija que la mxima probabilidad de error al
rechazar Ho debe ser igual a , otra manera de tomar la decisin es comparar el
valor del P- value con . As
- Si P entonces la decisin es Rechazamos Ho
- Si P > la decisin es No hay evidencia suficiente para rechazar Ho
PRUEBAS DE HIPTESIS UNILATERALES Y BILATERALES
Las pruebas o test de hiptesis se relacionan con los parmetros poblacionales
(medias o proporciones, etc.). Se puede utilizar los estimadores puntuales de los
parmetros poblacionales como estadstico del test en cuestin. Supongamos, como
ilustracin que se utiliza el smbolo para denotar el parmetro poblacional de
inters, por ejemplo, puede ser , (1- 2), p (p1-p2), y el smbolo para denotar
el estimador puntual insesgado correspondiente.
Desde el punto de vista prctico se puede tener inters en contrastar la hiptesis nula
H0: = 0, contra la alternativa de que el parmetro poblacional es mayor que 0, o

sea H1: > 0. En esta situacin, se rechazar H 0 cuando sea grande, o sea cuando
el estadstico del test sea mayor que un cierto valor llamado valor crtico, que separa
las regiones de rechazo y no rechazo del test.
La probabilidad de rechazar la hiptesis nula cuando es cierta ser igual al rea bajo
la curva de la distribucin muestral del estadstico del test sobre la regin de rechazo.
En el caso que estemos trabajando con una distribucin normal, y un = 0,05, se

rechaza la hiptesis nula cuando se encuentre a ms de 1,645 a la derecha de


0. De esta manera, se puede definir como
Una prueba estadstica de una cola o unilateral es aquella en la que la regin de
rechazo se localiza solamente en una cola o extremo de la distribucin muestral del
estadstico del test.

17

Para detectar > 0, se sita la regin de rechazo en la extremidad de valores

superiores a . Para detectar < 0 se ubica la regin de rechazo en la extremidad

izquierda de la distribucin de , o sea para valores inferiores a . Si hay que


detectar diferencias mayores o menores de 0, la hiptesis alternativa ser
H1: 0
es decir
> 0
o bien
< 0
En este caso la probabilidad de error Tipo I se repartir entre las dos colas de la

distribucin muestral del estadstico, y se rechazar H 0 para valores de mayores


que un valor crtico (0 + C) o menor que (0- C). Esta prueba se llama prueba
estadstica bilateral o de dos colas.
CONTRASTES DE HIPTESIS
Pueden presentarse en la prctica, situaciones en las que exista una teora
preconcebida relativa a la caracterstica de la poblacin sometida a estudio. Tal sera
el caso, por ejemplo si pensamos que un tratamiento nuevo puede tener un porcentaje
de mejora mayor que otro estndar, o cuando nos planteamos si los nios de las
distintas comunidades espaolas tienen la misma altura. Este tipo de circunstancias
son las que nos llevan al estudio de la parcela de la Estadstica Inferencial que se
recoge bajo el ttulo genrico de Contraste de Hiptesis. Implica, en cualquier
investigacin, la existencia de dos teoras o hiptesis implcitas, que denominaremos
hiptesis nula e hiptesis alternativa, que de alguna manera reflejarn esa idea a priori
que tenemos y que pretendemos contrastar con la realidad.
De la misma manera aparecen, implcitamente, diferentes tipos de errores que
podemos cometer durante el procedimiento. No podemos olvidar que, habitualmente,
el estudio y las conclusiones que obtengamos para una poblacin cualquiera, se
habrn apoyado exclusivamente en el anlisis de slo una parte de sta. De la
probabilidad con la que estemos dispuestos a asumir estos errores, depender, por
ejemplo, el tamao de la muestra requerida. Desarrollamos en este captulo los
contrastes de hiptesis para los parmetros ms usuales que venimos estudiando en
los captulos anteriores: medias, varianzas y proporciones, para una o dos
poblaciones. Los contrastes desarrollados en este captulo se apoyan en que los datos
de partida siguen una distribucin normal.
Los contrastes de significacin se realizan:
- suponiendo a priori que la ley de distribucin de la poblacin es conocida.
- Se extrae una muestra aleatoria de dicha poblacin.

18

- Si la distribucin de la muestra es diferente de la distribucin de probabilidad que


hemos asignado a priori a la poblacin, concluimos que probablemente sea errnea
la suposicin inicial.
Ejemplo, Supongamos que debemos realizar un estudio sobre la altura media de los
habitantes de cierto pueblo. Antes de tomar una muestra, lo lgico es hacer la
siguiente suposicin a priori, (hiptesis que se desea contrastar y que
denotamos H0):
H0: la altura media no difiere del resto del pas
Al obtener una muestra de tamao n=8, podramos encontrarnos ante uno de los
siguientes casos:
1. Muestra = {1,50 ;1,52; 1,48; 1,55; 1,60; 1,49; 1,55; 1,63}
2. Muestra = {1,65; 1,80; 1,73; 1,52; 1,75; 1,65; 1,75; 1,78}

19

Intuitivamente, en el caso a sera lgico suponer que salvo que la muestra obtenida
sobre los habitantes del pueblo sea muy poco representativa, la hiptesis H0 debe ser
rechazada. En el caso b tal vez no podamos afirmar con rotundidad que la hiptesis
H0 sea cierta, sin embargo no podramos descartarla y la admitimos por una cuestin
de simplicidad.
Este ejemplo sirve como introduccin de los siguientes conceptos: En un contraste de
hiptesis (tambin denominado test de hiptesis o Contraste de significacin) se
decide si cierta hiptesis H0 que denominamos hiptesis nula puede ser rechazada o
no a la vista de los datos suministrados por una muestra de la poblacin. Para realizar
el contraste es necesario establecer previamente una hiptesis alternativa (H1) que

20

ser admitida cuando H0 sea rechazada. Normalmente H1 es la negacin de H0,


aunque esto no es necesariamente as.
El procedimiento general consiste en definir un estadstico T relacionado con la
hiptesis que deseamos contrastar. A ste lo denominamos estadstico del contraste.
A continuacin suponiendo que H0 es verdadera se calcula un intervalo de
denominado intervalo de aceptacin de la hiptesis nula, (T i,Ts) de manera que al
calcular sobre la muestra T=Texp el criterio a seguir sea:
Si Texp (Ti,Ts), entonces aceptamos Ho o rechazamos H1, y si Texp (Ti,Ts), entonces
rechazamos Ho o aceptamos H1
El intervalo de aceptacin o ms precisamente, de no rechazo de la hiptesis nula, se
establece fijando una cantidad suficientemente pequea denominada nivel de
significacin, de modo que la probabilidad de que el estadstico del contraste tome un
valor fuera del mismo - regin crtica- cuando la hiptesis nula es cierta sea inferior
o al 100-%; Esto se ha de entender como sigue:
Si H0 es correcta el criterio de rechazo slo se equivoca con probabilidad , que es la
probabilidad de que una muestra d un valor del estadstico del contraste extrao
(fuera del intervalo de aceptacin). La decisin de rechazar o no la hiptesis nula est
al fin y al cabo basado en la eleccin de una muestra tomada al azar, y por tanto es
posible cometer decisiones errneas. Los errores que se pueden cometer se clasifican
como sigue:
Error de tipo I: Es el error que consiste en rechazar H0 cuando es cierta. La
probabilidad de cometer este error es lo que anteriormente hemos denominado nivel
de significacin. Es una costumbre establecida el denotarlo siempre con la letra
=P(Rechazar H0/H0 es cierta)=P(Aceptar H1/H0 es cierta)
Error de tipo II: Es el error que consiste en no rechazar H0 cuando es falsa. La
probabilidad de cometer este error la denotamos con la letra =P(Rechazar H1/H1
es cierta)=P(Aceptar H0/H1 es cierta)
1. Los errores de tipo I y II no estn relacionados ms que del siguiente modo:
Cuando decrece crece. Por tanto no es posible encontrar tests que hagan tan
pequeos como queramos ambos errores simultneamente. De este modo es
siempre necesario privilegiar a una de las hiptesis, de manera que no ser
rechazada, a menos que su falsedad se haga muy evidente. En los contrastes, la
hiptesis privilegiada es H0 que slo ser rechazada cuando la evidencia de su
falsedad supere el umbral del 100*(1-)%.

21

2. Al tomar muy pequeo tendremos que se puede aproximar a uno. Lo ideal a la


hora de definir un test es encontrar un compromiso satisfactorio entre y
(aunque siempre a favor de H0). Denominamos potencia de un contraste a la
cantidad 1-, es decir
Potencia=1-=P(Rechazar H0/H0 es falsa)

Ho es Cierta

Ho es Falsa

Aceptar Ho
Correcto
Probabilidad 1
Error Tipo II
Probabilidad

Rechazar Ho
Error tipo I
Probabilidad
Correcto
Probabilidad 1

En el momento de elegir una hiptesis privilegiada podemos en principio dudar entre


si elegir una dada o bien su contraria. Criterios a tener en cuenta en estos casos son
los siguientes:
Simplicidad cientfica: A la hora de elegir entre dos hiptesis cientficamente
razonables, tomaremos como H0 aquella que sea ms simple.
Las consecuencias de equivocarnos: Por ejemplo al juzgar el efecto que puede
causar cierto tratamiento mdico que est en fase de experimentacin, en principio se
ha de tomar como hiptesis nula aquella cuyas consecuencias por no rechazarla
siendo falsa son menos graves, y como hiptesis alternativa aquella en la que el
aceptarla siendo falsa trae peores consecuencias.
Volviendo al ejemplo de la estatura de los habitantes de un pueblo, un estadstico de
contraste adecuado es X . Si la hiptesis H0 fuese cierta se tendra que X~N(2/n)
(suponiendo claro est que la distribucin de las alturas de los espaoles siga una
distribucin normal de parmetros conocidos, por ejemplo N(1.74,100)
Denotemos mediante 0 el verdadero valor de la media en el pueblo que estudiamos.
Como la varianza de X es pequea para grandes valores de n, lo lgico es pensar
que si el valor obtenido con la muestra X x est muy alejado de =1.74 (regin
crtica), entonces
- o bien la muestra es muy extraa si H0 es cierta (probabilidad );
- o bien la hiptesis H0 no es cierta.
Concretamente
en
el
caso
a,
donde
la
muestra
es
(1.50,1.52,1.48,1.55,1.60,1.49,1.55,1.63)
el contraste de hiptesis conveniente es:

22

H0:=0

H1:>0

En este caso H1 no es estrictamente la negacin de H0. Esto dar lugar a un contraste


unilateral, que son aquellos en los que la regin crtica est formada por un slo
intervalo: Intervalo re rechazo de H0: (Ti,). Regin crtica: (,Ti)
Contrastes paramtricos en una poblacin normal. Supongamos que la
caracterstica X que estudiamos sobre la poblacin sigue una distribucin normal y
tomamos una muestra de tamao n: X1,..,Xn mediante muestreo aleatorio simple.
Vamos a ver cuales son las tcnicas para contrastar hiptesis sobre los parmetros que
rigen X. Vamos a comenzar haciendo diferentes tipos de contrastes para medias y
despus sobre las varianzas y desviaciones tpicas.
CONTRASTES PARA LA MEDIA
Test de dos colas con varianza conocida. Suponemos que X~N() donde es
conocido y queremos contrastar si es posible que (desconocida) sea en
realidad cierto valor0 fijado. Esto es un supuesto terico que nunca se dar
en la realidad pero servir para introducir la teora sobre contrastes. El test se
escribe entonces como:
H0:=0
H1:0
Como hemos mencionado anteriormente, la tcnica para hacer el contraste consiste en
suponer que H0 es cierta, y averiguar con esta hiptesis quien es la distribucin del
estadstico del contraste que este caso es lgico que deba estar muy relacionado con
X . Si al obtener una muestra concreta se tiene que X x es un valor muy alejado de
0, se debe rechazar H0. Veamos esto con ms detalle:
H0 cierta X~N(0,) entonces, Z exp

X 0

N (0,1)

Para poder acceder a las probabilidades de la normal, hemos tipificado (ya que los
valores para hacer la tipificacin son conocidos). Si H0 es cierta, entonces esperamos
que el valor zexp obtenido sobre la muestra est cercano a cero con una gran
probabilidad. Esto se expresa fijando un nivel de significacin , y tomando como
regin crtica C, a los valores que son muy extremados y con probabilidad en total,
o sea,
P( Z exo z / 2 ) / 2

P( Z exo z 1 / 2 ) / 2 P(z 1 / 2 Z z 1 / 2 ) 1

Entonces la regin crtica consiste en C z exp : z exp z 1 / 2


Luego rechazaremos la hiptesis nula si z exp z 1 / 2 , aceptando en consecuencia la
hiptesis alternativa.

23

La regin de rechazo de la hiptesis nula es la sombreada. Se rechaza H0 cuando el


estadstico zexp toma un valor comprendido en la zona sombreada de la grfica
pequea, N(0,1), o equivalentemente, cuando el estadstico X toma un valor en la
zona sombreada de la grfica grande, N(0,).

Tests de una cola con varianza conocida. Consideremos un contraste de hiptesis


donde ahora la hiptesis alternativa es compuesta:
H0:=0
H1:<0
Bajo la hiptesis nula la distribucin de la media muestral es
H0 cierta X~N(0,) entonces, Z exp

X 0

N (0,1)

y como regin crtica consideraremos aquella formada por los valores


extremadamente bajos de Zexp, con probabilidad , es decir
P(Zexpza)=, entonces, P(zazexp)=1-
Entonces la regin de aceptacin, o de modo ms correcto, de no rechazo de la
hiptesis nula es: zexp>za Se rechaza la hiptesis nula, cuando uno de los estadstico Z
o X toma un valor en la zona sombreada (similar a la grfica anteriormente
mostrada).
Es evidente que si en el contraste de significacin, hubisemos tomado como
hiptesis alternativa su contraria, es decir
H0:=0
H1:>0
por simetra con respecto al caso anterior, la regin donde no se rechaza la hiptesis
nula es: z>z
Test de dos colas con varianza desconocida. Sea X~N() donde ni ni son
conocidos y queremos realizar el contraste

24

H0:=0
H1:0
Al no conocer va a ser necesario estimarlo a partir de su estimador insesgado: la
cuasivarianza muestral, s 2 , Por ello la distribucin del estimador del contraste ser
una t-Student, que ha perdido un grado de libertad, segn el teorema de Cochran, y la
definicin de la distribucin de t-Student:
H0 cierta Texp

X 0
s

t n 1

Consideramos como regin crtica C, a las observaciones de Texp extremas


P(Texpt/2,n-1)=, y P(Texpt1-/2,n-1)=entonces, P(-t1/2,n-1zTexpt1-/2,n-1)=1-
Entonces la regin crtica consiste en C Texp t 1 / 2,n 1

T1 / 2 ,n 1 Texp

Para dar una forma homognea a todos los contrastes de hiptesis es costumbre
denominar al valor del estadstico del contraste calculado sobre la muestra como
valor experimental y a los extremos de la regin crtica, como valores tericos.
Definiendo entonces
Texp

X 0
s n

Tteo t 1 / 2,n 1

el resultado del contraste es el siguiente: Si


contrario si.

Texp Tteo

no rechazamos H0, de

Tests de una cola con varianza desconocida. Si realizamos el contraste


H0:=0
H1:<0
por analoga con el contraste bilateral, definiremos
Texp

X 0
s n

Tteo t 1 ,n 1

y el criterio para contrastar al nivel de significacin a es:


Si Texp Tteo no rechazamos H0, de contrario si.
Para el contraste contrario,
H0:=0
H1:>0
definimos Texp y Tteo como anteriormente y el criterio a aplicar es:
Si Texp Tteo no rechazamos H0, de contrario si.
Ejemplo. Conocemos que las alturas X de los individuos de una ciudad, se
distribuyen de modo gaussiano. Deseamos contrastar con un nivel de

25

significacin de =5% si la altura media es diferente de 174 cm. Para ello nos
basamos en un estudio en el que con una muestra de n=25 personas se obtuvo:
media 170 y desviacin 10
Solucin: El contraste que se plantea es:
H0:=
H1:174
La tcnica a utilizar consiste en suponer que H0 es cierta y ver si el valor que toma el
estadstico
Texp

X 174
t 24
s n

es razonable o no bajo esta hiptesis, para el nivel de significacin dado.


Aceptaremos la hiptesis alternativa (y en consecuencia se rechazar la hiptesis
nula) si no lo es, es decir, si
Texp t 1 / 2 , 24 t 0.975, 24 2.06

Para ello procedemos al clculo de Texp con s=10, y n=25


s s
Texp

n
25
10
10.206
entonces
n 1
24
170 174

1.959 2.06
10.206 25

Luego, aunque podamos pensar que ciertamente el verdadero valor de no es 174, no


hay una evidencia suficiente para rechazar esta hiptesis al nivel de confianza del
95%. Es decir, no se rechaza H0.
El valor de Texp no est en la regin crtica (aunque ha quedado muy cerca), por tanto
al no ser la evidencia en contra de H0 suficientemente significativa, sta hiptesis no
se rechaza.

26

CONTRASTES PARA LA VARIANZA


Consideremos que el carcter que estudiamos sobre la poblacin sea una variable
aleatoria normal cuya media y varianza son desconocidas. Vamos a contrastar la
hiptesis
2
H0: =02,
donde 02 es un valor prefijado frente a otras hiptesis alternativas que podrn dar
lugar a contrastes bilaterales o unilaterales. La tcnica consiste en utilizar el teorema
de Cochran, para observar que el siguiente estadstico experimental que utiliza el
estimador insesgado de la varianza, posee una distribucin 2 , con n-1 grados de
libertad:
s 2
2
2
H0: cierta exp (n 1) 2 n 1
0
Entonces construimos las regiones crticas que correspondan a las hiptesis
alternativas que se formulen en cada caso atendiendo a la ley de distribucin 2 .
Contraste bilateral. Cuando el contraste a realizar es
H 0 : 2 02

H1 : 2 02

entonces, definimos
s 2
2
exp (n 1) 2
a teo 2 / 2,n 1
0

b teo 12 / 2,n 1

y el criterio que suministra el contraste es el expresado en la figura:

27

2
Si a teo exp b teo aceptamos a H0, de contrario lo rechazamos

Contrastes unilaterales. Para un contraste de significacin al nivel del tipo


H 0 : 2 02

H1 : 2 02

Entonces, a teo , n 1
2
Si a teo exp aceptamos a H0, de contrario lo rechazamos
2

Para el contraste contrario tenemos la formulacin anloga:


H 0 : 2 02

H1 : 2 02

Entonces, b teo 1 ,n 1
2
Si a teo exp aceptamos a H0, de contrario lo rechazamos
2

CONTRASTES DE UNA PROPORCIN


Supongamos que poseemos una sucesin de observaciones independientes, de modo
que cada una de ellas se comporta como una distribucin de Bernoulli de
parmetro p: X1,Xn~Binomial de parmetro p.
La variable aleatoria X=X1+X2++Xn~B(n,p). La proporcin muestral (estimador
del verdadero parmetro p a partir de la muestra) es p X / n
Nos interesamos en el contraste de significacin de H0: p=p0, siendo p un valor
prefijado frente a otras hiptesis alternativas. Para ello nos basamos en un estadstico
(de contraste) que ya fue considerado anteriormente en la construccin de intervalos
de confianza para proporciones y que sigue una distribucin aproximadamente
normal para tamaos muestrales suficientemente grandes:

28

X N p, pq
P
n
n

Si la hiptesis H0 es cierta se tiene


p q
P p 0
X

P N p 0 , 0 0
Z exp N(0,1)
n
n
p0q 0 n

Contraste bilateral. Para el contraste


H0 : p p0

H1 : p p 0

extraemos una muestra y observamos el valor X=x, entonces


define
Z exp

p p 0

p0q 0 n

x/n.
p

Entonces se

Z teo z 1 / 2

siendo el criterio de aceptacin o rechazo de la hiptesis nula


Si z exp Z teo aceptamos a H0, de contrario lo rechazamos
Contrastes unilaterales. Consideremos un contraste del tipo
H0 : p p0

H1 : p p 0

Definiendo a
Z exp

p p 0

Z teo z

p 0q 0 n

siendo el criterio de aceptacin o rechazo de la hiptesis nula


Si z exp Z teo rechazamos a H0, de contrario lo aceptamos
Para el test unilateral contrario, se tiene la expresin simtrica:
H0 : p p0

H1 : p p 0

Definiendo a
Z exp

p p 0
p0q 0 n

Z teo z 1

siendo el criterio de aceptacin o rechazo de la hiptesis nula


Si z exp Z teo aceptamos a H0, de contrario lo rechazamos
CONTRASTES PARA LA DIFERENCIA DE MEDIAS APAREADAS

29

Las muestras apareadas aparecen como distintas observaciones realizadas sobre los
mismos individuos. Un ejemplo de observaciones apareadas: Medir a un
conjunto de n personas el nivel de insulina en la sangre antes (X) y despus (Y)
del tratamiento
Pacient
e
1

xi

yi

150

140

120

90

Diferencia
di
30

50

No es posible considerar a X y Y como variables independientes ya que va a existir


una dependencia clara entre las dos variables. Si queremos contrastar el que los
pacientes han experimentado o no una mejora con el tratamiento, llamemos di a la
diferencia entre las observaciones antes y despus del tratamiento di=xi-yi.
Supongamos que la variable aleatoria que define la diferencia entre el antes y despus
del tratamiento es una variable aleatoria d que se distribuye normalmente, pero cuyas
media y varianza son desconocidas
d~N(d,d)
Si queremos contrastar la hiptesis de que el tratamiento ha producido cierto efecto
H0: d=
en el caso en que H0 fuese cierta tendramos que el estadstico de contraste que nos
conviene es
Texp

d
t n 1
s d
n

donde d es la media muestral de las diferencias di y s d es la cuasivarianza muestral


de las mismas. El tipo de contraste sera entonces del mismo tipo que el realizado
para la media con varianza desconocida.
Contraste bilateral. Consideramos el contraste de tipo
H0: d=
d
Entonces se define
Texp

d
t n 1
s d
n

y se rechaza la hiptesis nula cuando Texp t 1 / 2,n 1 Texp t 1 / 2,n 1


Contrastes unilaterales. Si el contraste es
H0: d=
d<

30

se rechaza la hiptesis nula cuando Texp t 1 , n 1 . Para el test contrario


H0: d=
d>
se rechaza la hiptesis nula cuando Texp t 1 , n 1
No supone ninguna dificultad el haber realizado el contraste con d2 conocida, ya que
entonces el estadstico del contraste es
Z

d
N(0,1) y el tratamiento sera anlogo.
s d
n

CONTRASTES
DE
INDEPENDIENTES

DOS

DISTRIBUCIONES

NORMALES

Consideramos a lo largo de toda esta seccin a dos poblaciones normales que


representamos mediante X1~N(1,1) y X2~N(2,2)
De las que de modo independiente se extraen muestras de tamao respectivo n1 y n2.
Los tests que vamos a realizar estn relacionados con las diferencias existentes entre
ambas medias o los cocientes de sus varianzas.
CONTRASTE DE MEDIAS CON VARIANZAS CONOCIDAS
De manera similar al caso del contraste para una media, queremos en esta ocasin
contrastar la hiptesis de que las dos poblaciones (cuyas varianzas suponemos
conocidas) slo difieren en una cantidad
H0: 1-2=
frente a hiptesis alternativas que darn lugar a contrastes unilaterales o bilaterales
como veremos ms tarde. Para ello nos basamos en la distribucin del siguiente
estadstico de contraste:
H0
es cierta X 1 N 1 , 1
n1
y

X 1 X 2 N , s 1
Z

X2

2
2

n1
n2
2
1

n1 , s 2

n2

X2 N

entonces,

N (0,1)

Contraste bilateral. Consideremos en primer lugar el contraste de dos colas


H0: 1-2= H0: 1-2
Se define entonces

31

Z exp

X2
12 22

n1 n 2

Z teo z 1 / 2

y el test consiste en
Z exp Z teo aceptamos H0 y rechazamos H1
Contrastes unilaterales. Para el test
H0: 1-2= H0: 1-2<
y el test consiste en

Z teo z z1 entonces, si Zexp Zteo

aceptamos H0 y rechazamos H1

y para el contraste de significacin contrario


H0: 1-2= H0: 1-2>
y el test consiste en

Z teo z1 entonces, si Zexp Z teo

aceptamos H0 y rechazamos H1

CONTRASTE DE MEDIAS HOMOCEDTICAS


Ahora consideramos el problema de contrastar
H0: 1-2=
cuando slo conocemos que las varianzas de ambas poblaciones son iguales, pero
desconocidas. El estadstico que usaremos para el contraste fue ya introducido en la
relacin, pues si suponemos que H0 es cierta se tiene
X X 2 1 2 t
Texp 1
n n 2
1
1
s

n1 n 2
1

donde s 2 es la cuasivarianza muestral ponderada de s12 y de s 22 donde

n 1 1 s12 n 2 1 s 22
2
s
n1 n 2 2

32

Obsrvese que se han perdido dos grados de libertad a causa de la estimacin de


12 22 mediante s12 y de s 22 .
Contraste bilateral. Para el contraste de significacin
H0: 1-2=
H1: 1-2
se tiene como en casos anteriores que el contraste adecuado consiste en definir
X X 2 1 2 T t
Texp 1
teo
1 / 2 , n n 2
1
1
s

n1 n 2
1

y rechazar o admitir la hiptesis nula siguiendo el criterio


Texp Tteo aceptar H0
Contrastes unilaterales. Cuando el contraste es unilateral del modo
H0: 1-2=
H1: 1-2<
y rechazar o admitir la hiptesis nula siguiendo el criterio
Tteo t 1 / 2,n n 2 Texp Tteo aceptar H0
1

y cuando el contraste de significacin es el contrario


H0: 1-2=
H1: 1-2>
y rechazar o admitir la hiptesis nula siguiendo el criterio
Tteo t 1 ,n n 2 Texp Tteo aceptar H0
1

CONTRASTE DE MEDIAS NO HOMOCEDTICAS


Consideramos el contraste
H0: 1-2=
en el caso ms problemtico, es decir cuando slo conocemos de las dos poblaciones
que su distribucin es normal, y que sus varianzas no son conocidas y
significativamente diferentes. En este caso el estadstico de contraste tendr una ley
de distribucin muy particular. Consistir en una distribucin t-Student, con un
nmero de grados de libertad que en lugar de depender de modo determinista de la
muestra (a travs de su tamao), depende de un modo aleatorio mediante las
varianzas mustrales. Concretamente, el estadstico que nos interesa es

33

X2
s12 s 22

n1 n 2

donde es el nmero de grados de libertad que se calcula mediante la frmula de


Welch:
s12 s 22


n 1 n 2

2
2
2
1 s12
1 s 22

n 1 1 n 1
n 2 1 n 2
No desarrollamos en detalle los clculos a realizar, pues la tcnica para efectuar los
contrastes son anlogos a los vistos anteriormente cuando las varianzas son
desconocidas e iguales. Si lo que pretendemos contrastar es si las medias
poblacionales de dos muestras independientes obtenidas de poblaciones
normales son idnticas, esto se reduce a los casos anteriores tomando =0
CONTRASTES DE LA RAZN DE VARIANZAS
Consideramos dos muestras independientes de dos poblaciones que se distribuyen
normalmente (cuyas medias y varianzas son desconocidas). Vamos a abordar
cuestiones relacionadas con saber si las varianzas de ambas poblaciones son las
mismas, o si la razn (cociente) entre ambas es una cantidad conocida, R. La
igualdad entre las dos varianzas puede escribirse 12-22=0 o bien, la existencia
de una diferencia entre ambas (), del modo 12-22=. Este modo de escribir la
diferencia entre varianzas (que era el adecuado para las medias) no es sin
embargo fcil de utilizar para las varianzas, de modo que nos ser ms fcil
sacarle partido a las expresiones de las relaciones entre varianzas como
2
1
R
22
Por ejemplo, si R=1 tenemos que ambas varianzas son iguales. Consideramos
entonces la hiptesis nula
12
H0 : 2 R
2
la cual vamos a contrastar teniendo en cuenta que:

34

(n 1 1)s12
2n1 1
2
1

(n 2 1)s 22
2n 2 1 que conlleva
2
2

1 (n 1 1)s12
n 1 1 12
s12 12 22 s12

Fn 1,n 1
1
2
1 (n 2 1)s 22 s 22 22 12 s 22
n2 1
22
Por tanto el estadstico del contraste que nos conviene tiene una distribucin conocida
cuando H0 es cierta. Vase la definicin de la distribucin de F-Snedecor:
1 s12
F
Fn1 1, n 2 1
R s 22
Contraste bilateral. El contraste bilateral para el cociente de varianzas se escribe
como:
12
12
H0 : 2 R
H0 : 2 R
2
2
Habida cuenta que la distribucin F-Snedecor no es simtrica sino que slo toma
valores positivos, se rechazar la hiptesis nula cuando el valor que tome el
estadstico del contraste al aplicarlo sobre una muestra sea muy cercano a cero, o
bien, muy grande. Es decir, se define el estadstico experimental y los lmites de la
regin crtica como:
1 s12
Fexp
a teo F / 2,n1 1,n 2 1
b teo F1 / 2,n1 1,n 2 1
R s 22
y el criterio de aceptacin o rechazo es:

si a teo Fexp b teo aceptamos a H0

No se debe olvidar que para la funcin F-Snedecor, F / 2, n1 1, n 2 1 F1 / 2, n1 1, n 2 1


dada la no simetra de F. A la hora de usar una tabla de la distribucin podemos tal
vez encontrar que no est tabulada para los valores pequeos, pero si para 1-. Una
regla que es de bastante utilidad para estos casos es la siguiente (ojo, se invierten los
ordenes de los grados de libertad),
F , n , m

1
F1 , m , n

Contrastes unilaterales. El primer contraste unilateral que consideramos es:

35

H0 :

12
R
22

H0 :

12
R
22

para el cual se tiene a teo F ,n

1 1, n 2 1

, si a teo Fexp aceptamos a H0

El tests unilateral opuesto es:


12
12
H0 : 2 R
H0 : 2 R
2
2
para el cual se tiene b teo F1 , n

1 1, n 2 1

, si Fexp b teo aceptamos a H0

Caso particular: Contraste de homocedasticidad. En la prctica un contraste de gran


inters es el de la homocedasticidad o igualdad de varianzas. Decimos que dos
poblaciones son homocedticas si tienen la misma varianza. El test de
homocedasticidad sera entonces el mismo que el de un cociente de varianzas,
donde R=1, es decir:
12
12
2
2
1 2 H 0 : 2 1
H1 : 2 1
2
2
Una de las razones de la importancia de este contraste es la siguiente: Si queremos
estudiar la diferencia entre las medias de dos poblaciones normales, el caso ms
realista es considerar un contraste donde las varianzas de las poblaciones son
desconocidas. Ante esta situacin podemos encontrarnos dos situaciones:
1. Las dos varianzas son iguales. Este es el caso ms favorable pues utilizamos la
distribucin de Student para el contraste con un nmero de grados de libertad que
slo depende del tamao de la muestra.
2. Las varianzas son distintas. En este caso el nmero de grados de libertad es una
variable aleatoria (frmula de Welch) y por tanto al realizar el contraste se pierde
cierta precisin.
En esta situacin lo recomendable es
- En primer lugar realizar un test de homocedasticidad.
- Si la igualdad de varianzas no puede ser rechazada de modo significativo,
aplicamos un test de diferencia de medias suponiendo que las varianzas son
desconocidas pero iguales.
En otro caso se utiliza la aproximacin de Welch.

36

Al realizar el contraste bilateral sobre la igualdad de varianzas podemos tambin


economizar parte de trabajo definiendo Fexp como el cociente entre la mayor varianza
muestral y la menor

s12 2 2
2 s1 s2
s2

Fexp 2 Fexp 1
s2 s2 s2
s2 2 2
1
ya que as no es necesario calcular el extremo inferior para la regin donde no se
rechaza H0, pues Fexp nunca estar prxima a 0. Con esta definicin de Fexp el criterio a
seguir frente al contraste de significacin para un valor dado es,
Criterio para el rechazo de la hiptesis nula sobre la homocedasticidad. Aunque en
realidad el test a realizar es bilateral, al elegir el estadstico del contraste de modo que
el numerador sea mayor que el numerador, podemos concentrar toda la probabilidad
del error de tipo I,, en la cola derecha de la distribucin.

F s s F b aprobar H
Fteo 2 2
F1,n21,n11 s2 s1 Fexp bteo rechaz r H0
22
1,n11,n21 1 2 exp teo 0

37

Ejemplo. Se desea comparar la actividad motora espontnea de un grupo de 25 ratas


control y otro de 36 ratas desnutridas. Se midi el nmero de veces que
pasaban delante de una clula fotoelctrica durante 24 horas. Los datos
obtenidos fueron los siguientes:
Ratas de control
n1=25
x 1 =869. S1=106.7
8
Ratas Desnutridas n2=36
S2=153.7
x 2 =465
Se observan diferencias significativas entre el grupo control y el grupo desnutrido?
Solucin: En primer lugar, por tratarse de un problema de inferencia estadstica, nos
sern ms tiles las cuasivarianzas que las varianzas. Por ello calculamos:
n 1 2 25
n 2 2 36
2
106.7 2 11.859
s12
s1
s 22
s 2 153.7 24.298
n1 1
24
n2 1
35
El contraste que debemos realizar est basado en el de la t-Student para la diferencia
de medias de dos poblaciones. Para ello conocemos dos estadsticos posibles, segn
que las varianzas poblacionales de ambos grupos de ratas puedan ser supuestas
iguales (homocedasticidad) o distintas (heterocedasticidad). Para ello realizamos
previamente el contraste:
2
2
H 0 : 12 1
H 1 : 12 1
2
2
Suponiendo H0 cierta, tenemos que el estadstico del contraste conveniente es

38

s12 2 2
2 s1 s2
s2

Fexp 2 Fexp 1
s2 s2 s2
s2 2 2
1
ya que as no es necesario calcular el extremo inferior para la regin donde no se
rechaza H0. En este caso:
s 22
Fexp 2 2.049 Fn 2 1,n1 1
Fteo 2.97
s1
Como FexpTteo, no podemos concluir (al menos al nivel de significacin =5%) que
H0 deba ser rechazada.
No hay evidencia significativa para rechazar la homocedasticidad. El estadstico del
contraste ha sido elegido modo que el numerador de Fexp sea mayor que el
denominador, es decir, Fexp>1.
Por lo tanto no rechazamos la hiptesis de homocedasticidad de ambas poblaciones, y
pasamos a contrastar la igualdad de las medias,
H0: 1-2=0
H1: 1-20
utilizando el estadstico ms sencillo (el que no necesita aproximar los grados de
libertad mediante la frmula de Welch). Para ello calculamos en primer lugar la
cuasivarianza muestral ponderada y los valores del test:
(n 1)s12 (n 2 1)s 22
s 2 1
19.238
n1 n 2 2
x1 x 2
Texp
11.210 t n n 2 t 59
1
1
s

n1 n 2
1

39

Como Tteo Texp concluimos que se ha de rechazar la hiptesis de igualdad de las


medias, y por tanto aceptamos que las medias son diferentes. Adems, como se
aprecia en la figura, la evidencia a favor de la hiptesis alternativa es muy alta, y se
puede afirmar que con gran probabilidad la media poblacional de las ratas de control
es mayor que la de las ratas desnutridas.
Hay una gran evidencia en contra de la hiptesis de que ambas medias poblacionales
coincidan, y a favor de que la de la primera poblacin es mayor que la de la segunda.

CONTRASTES SOBRE LA DIFERENCIA DE PROPORCIONES


Supongamos que tenemos dos muestras independientes tomadas sobre dos
poblaciones, en laque estudiamos una variable de tipo dicotmico (Bernoulli):

X 1 X 11 ,..., X 1n1

X 2 X 21 ,.., X 2 n 2

40

Si X1 y X2 contabilizan en cada caso el nmero de xitos en cada muestra se tiene que


cada una de ellas se distribuye como una variable aleatoria binomial:
n1

X1 X 1i B(n 1 , p1 )
i 1

n1

X 2 X 2i B(n 2 , p 2 )
i 1

de modo que los estimadores de las proporciones en cada poblacin tienen


distribuciones que de un modo aproximado son normales (cuando n1 y n2 son bastante
grandes)

X
pq
X
p q
P1 1 N p1 , 1 1
P2 2 N p 2 , 2 2
n1
n1
n2
n2

El contraste que nos interesa realizar es el de si la diferencia entre las proporciones en


cada poblacin es una cantidad conocida
H0: p1-p2=
Si H0 fuese cierta se tendra que

pq
p q
P1 P2 N p1 p 2 , 1 1 2 2
n1
n2

Desafortunadamente ni p1 ni p2 son conocidos de antemano y utilizamos sus


estimadores, lo que da lugar a un error que es pequeo cuando los tamaos mustrales
son importantes:
(p1 p 2 )
Z exp N (0,1)
p1q 1 p 2 q 2

n1
n2
Contraste bilateral. El contraste bilateral sobre la diferencia de proporciones es
H0: p1-p2=
H1: p1-p2
Entonces se define
(p p 2 )
Z exp 1
p1q 1 p 2 q 2

n1
n2
y se rechaza la hiptesis nula si Z exp z1 / 2 o si Z exp z 1 / 2
Contrastes unilaterales. En el contraste
H0: p1-p2=
H1: p1-p2<

41

y se rechaza la hiptesis nula si Z exp z1 / 2 y para el test contrario,


H0: p1-p2=
H1: p1-p2>
y se rechaza la hiptesis nula si Z exp z 1 / 2

42