• OBJETIVO: Estimar el parámetro desconocido θ de la población a partir de una muestra aleatoria usando la teoría de pruebas de hipótesis. PRUEBA (CONTRASTE) DE HIPÓTESIS ESTADISTICA. Formulación general Si θ es un parámetro desconocido, es decir una constante,que caracteriza a la población en estudio, que puede ser determinado con ayuda de los modelos de probabilidad de una o varias poblaciones univariantes o multivariantes, podemos estar interesados en desarrollar la siguiente prueba de hipótesis estadística : • TIPOS DE HIPÓTESIS • La hipótesis nula Ho es la hipótesis que el investigador quiere rechazar y la hipótesis alternativa H1 es la hipótesis que quiere aceptar y probar. Las dos hipótesis son contrarias, osea si se acepta la hipótesis nula se rechaza la alternativa y viceversa.
• SUPOSICIÓN Primero se asume que la
población tiene distribución normal o aproximadamente normal, esto es Xi con distribución N(μ, σ2) donde el parámetro θ desconocido a estimarse puede ser μ ó σ2 , esto se hace para que las conclusiones a que se llegan de la prueba sean válidas osea tengamos buenas inferencias estadísticas.
• ERROR DE LA PRUEBA Al realizar una prueba
de hipótesis siempre se obtiene un error que se trata de minimizar. Tenemos dos tipos de errores: • Error tipo I , se comete cuando se rechaza Ho siendo que Ho es verdadera y su probabilidad P(error tipo I) = que puede ser 0.05 , 0.01 . Esta probabilidad se le conoce como el nivel de significación de la prueba. • Error tipo II , se comete cuando se acepta Ho siendo que Ho es falsa y su probabilidad P (error tipo II) = • Cuando se minimiza alfa el otro error crece y viceversa, así que minimizaremos una combinación lineal de alfa y beta. • CONDICIONES NECESARIAS • Para poder llevar a cabo dicha prueba de hipótesis es preciso disponer de lo siguiente:
1. Tener una muestra aleatoria de tamaño n de
la población en estudio.
2. Una estadística conveniente, relacionada de
alguna forma con el parámetro θ, que puede ser la media poblacional ó la variancia poblacional con distribución de probabilidad conocida. Esta distribución de probabilidad permitirá cuantificar el nivel de significación y el nivel de riesgo de este contraste, respecto a un criterio determinado. 3. Una regla o criterio llamada REGION CRITICA (R) es la región que contiene los valores de la estadística para los cuales se rechaza la H0, adoptando una decisión: rechazar o no esta hipótesis nula. Para un nivel de significación que puede ser fijado por el investigador, el criterio determinará de manera equivalente una región R, crítica o de rechazo de H0 y, entonces, se tendrá:
Para el nivel de significación se tiene :
PARTE PROCEDIMENTAL: PRUEBAS RELACIONADAS CON LA MEDIA DE UNA POBLACIÓN NORMAL • Ejemplo 1. Una máquina para enlatar conservas de pescado ha sido regulada para que el contenido de cada lata sea de 16 onzas. Usando =0.05 ¿diría usted que la máquina ha sido adecuadamente regulada, si una muestra de 20 latas dió un peso medio de 16.05 onzas y una desviación estándar de 1.5 onzas? • Solución: • Primer Paso. • Planteo de las hipótesis: Ho : u = 16 x H1 : u 16 • Segundo Paso • Fijar el valor del nivel de significación = 0.05 • Tercer Paso • Escoger la estadística adecuada cuya distribución por muestreo sea conocida, en el supuesto de que Ho es verdadera. • T = (X- µ) / (S/ √n ) con distribución t-student con (n-1) grados de libertad. • Cuarto Paso • Establecer la región crítica y el valor crítico ( o valores críticos) obtenido de la tabla estadística según la estadística escogida. Los valores críticos se determinan a partir de la igualdad
P( T > t(n-1) ) = ά / 2
Donde T es una variable con distribución t-
student con n-1 grados de libertad. Gráficamente, los valores críticos establecen los puntos frontera de la región crítica R : Dado que la región crítica se localiza en las "colas" izquierda y derecha de la función de densidad de la estadística utilizada, el contraste que estamos desarrollando se denomina bilateral. • En este ejemplo 1 el valor crítico para = 0.05 con 19 grados de libertad, es a la derecha 2.093 y a la izquierda -2.093, para valores comprendidos entre estos dos valores se acepta Ho caso contrario se rechaza Ho. • Quinto paso: • El valor de la estadística es: T = (16.05 – 16 ) / ( 1.5 / √20) = 0.149 • Sexto paso : Conclusión de la prueba: Como -2.093 < 0.149 < 2.093 se acepta Ho. Esto quiere decir que no hay evidencia estadística para rechazar Ho para =0.05 . En términos del ejemplo quiere decir que la máquina ha sido adecuadamente regulada. NOTA • Usando software estadístico (SPSS) para formular el criterio de rechazo de la hipótesis nula se usa el P-valor (llamado SIG) = P( T > t) osea es el area a la derecha del valor de la estadística hallada en el quinto paso. • Entonces, de manera equivalente se tiene: CONTRASTES DE HIPÓTESIS ESTADISTICAS. Valores medios en poblaciones independientes. • Contrastes sobre valores medios en poblaciones independientes. Con el fin de desarrollar de una forma más operativa un contraste de hipótesis, nos vamos a servir de la situación particular que afecta a dos poblaciones independientes, X e Y, con distribuciones normales N(μx,σx) y N(μy,σy) , respectivamente. Se supone, además, que las varianzas de estas poblaciones son desconocidas pero no significativamente distintas. Se pretende inicialmente contrastar la existencia de diferencias apreciables entre los valores medios de estas poblaciones: Actuaremos sistemáticamente, siguiendo los pasos señalados en la página anterior (θ = μx- μy y θo = 0):
Se extraerán muestras aleatorias de tamaños
n1 y n2 , de X e Y, respectivamente: Dada la información disponible, el estadístico a utilizar será: Este estadístico sigue una distribución T de Student con (n1+n2-2) grados de libertad. Fijado el nivel de significación, y bajo el supuesto de la veracidad de H0 (lo que supone μx-μy = 0), se adopta el siguiente criterio: Es decir, se duda de la veracidad de H0 cuando la diferencia entre las medias muestrales de las observaciones es "sustancialmente grande". Los valores críticos se determinan a partir de la igualdad