Está en la página 1de 3

TEMA 6

CONTRASTE ESTADÍSTICO DE HIPÓTESIS.

Una de las utilidades más importantes de la Inferencia Estadística es la contrastación de


hipótesis sobre alguna población. Entenderemos por hipótesis estadística cualquier conjetura que
realizamos sobre alguna característica de la población y llamaremos «contraste» o «test» de
hipótesis a una regla de que nos permita decidir sobre la validez de dicha conjetura.

En los temas anteriores hemos visto cómo utilizar la información muestral para definir
las características de una población. Así, dada una variable aleatoria X con función de densidad
, donde toma valores en un espacio paramétrico , y una muestra aleatoria simple
, ya somos capaces de decidir qué valor o valores podemos asignar al parámetro
bajo ciertos criterios (estimación puntual o por intervalo). Sin embargo, en muchas ocasiones
interesa comprobar si la información muestral apoya nuestra creencia algún valor concreto del
parámetro. Así, si consideramos una partición del espacio paramétrico de la forma ,
podemos plantearnos como hipótesis la pertenencia del verdadero valor de a uno u otro de los
subespacios, lo que se puede formalizar mediante la expresión:

donde la primera hipótesis recibe el nombre de hipótesis nula y la segunda el de hipótesis


alternativa. Ahora, debemos utilizar la información de una m.a.s. para dar una regla de decisión
sobre estas dos hipótesis. Para ello, hemos de particionar el espacio muestral en dos regiones C
y C* (llamadas región crítica y región de aceptación respectivamente), de forma que si el
resultado de la muestra está en C, decidimos a favor de H1, mientras que si está en C* decidimos
a favor de H0. Como la decisión se basa en el resultado de una variable aleatoria (la muestra),
podemos estar tomando la decisión correcta o no, con lo que aparecen dos formas de error,
VALIDEZ DE LA HIPÓTESIS
CARÁCTER DE LA DECISIÓN
H0 CIERTA H1 CIERTA
DECISIÓN ACEPTAMOS H0 CORRECTO ERROR II
ADOPTADA ACEPTAMOS H1 ERROR I CORRECTO

Ante este problema, parece lógico que pretendamos reducir al máximo la probabilidad
de error; pero si disminuimos uno de ellos normalmente se agranda el otro. Por este motivo se
ha considerado históricamente como regla fijar una probabilidad pequeña para el error de tipo
I y estudiar qué ocurre con el de tipo II. Esta elección introduce una cierta asimetría entre las
hipótesis; al ser menos probable el error de tipo I, cuando admitimos como cierta la hipótesis
alternativa estamos mucho más seguros que cuando lo hacemos con la hipótesis nula. Por este
motivo, se prefiere hablar de rechazar o no rechazar la hipótesis nula más que de aceptar H0 o
aceptar H1.

A la probabilidad de error de tipo I, es decir, a la probabilidad de rechazar la hipótesis


nula cuando es correcta se le llama nivel de significación o tamaño del contraste, y se representa
como . Normalmente se le dan los valores 0.05 ó 0.01, aunque son valores arbitrarios. La
probabilidad de error de tipo II se representa como , y a (1 - ), es decir, a la probabilidad de
rechazar la hipótesis nula cuando es falsa, se le llama potencia del contraste.

En muchos casos, la división del espacio muestral en dos partes no es viable, por lo que
se recurre a un estadístico suficiente que resuma la información en un número pequeño de
dimensiones. Si este estadístico, llamado de contraste, toma valores en la región crítica se
rechaza la hipótesis nula en favor de la alternativa; si, por el contrario, el estadístico cae en la
región de confianza, no hay suficiente evidencia empírica para rechazar la hipótesis nula, por lo
que se sigue manteniendo como cierta.

De esta forma, fijado el tamaño del test, la evaluación entre diversos contrastes debe
hacerse con base a su potencia. En teoría, el método para construir «buenos» test es más claro
cuando tanto la hipótesis nula como la alternativa sólo tienen un valor posible para el parámetro
(hipótesis simples), por lo que será éste el caso que analizaremos en primer lugar a través del
siguiente resultado:
Lema: (de Neyman-Pearson)

Supongamos una población X con función de densidad y una muestra aleatoria


simple ; si queremos contrastar la hipótesis

si existe una región C y una constante K tal que el cociente dentro de C

y fuera de C, entonces la decisión de rechazar H0 si

proporciona el test más potente entre todos los de nivel de significación .

La constante K se obtiene imponiendo que el nivel de significación sea .

Este resultado se puede extender fácilmente al caso de hipótesis alternativas con más de
un valor para el parámetro, proporcionando los test uniformemente más potentes (test U.M.P.).

También podría gustarte