Está en la página 1de 12

TEMA 1 PRUEBA DE HIPOTESIS

1.1 Definición
Definimos una hipótesis como una proposición o suposición a cerca de una o
varias poblaciones. Distinguiremos entre hipótesis de investigación e hipótesis
estadística. La primera es aquella hipótesis que formula el investigador como
una sospecha que resulta de la observación extensa y continua de un
fenómeno. Por ejemplo, un médico puede sospechar que el hábito de fumar
disminuye el promedio de vida de las personas, tal suposición puede llevar a la
siguiente hipótesis de investigación: la persona que fuma disminuye en 10 años
su vida promedio.

Hay dos hipótesis estadísticas: la hipótesis nula que representaremos por H o y


la hipótesis alternativa que escribiremos como H1. La hipótesis nula es la
hipótesis que se va a verificar o probar estadísticamente. El procedimiento de
prueba esta basado en la información contenida en los datos muéstrales y el
resultado es una de dos decisiones: rechazar la hipótesis nula como falsa o no
rechazarla porque los datos no proporcionan suficiente evidencia para
rechazarla. Las hipótesis nula y alternativa se establecen de tal manera que
sean mutuamente excluyentes y complementarias. Por lo tanto, cuando
rechazamos la hipótesis nula estamos aceptando a la vez la hipótesis
alternativa como verdadera y lo contrario. Generalmente, pero no siempre la
hipótesis alternativa es la misma hipótesis de investigación y en el proceso de
prueba se espera negar o rechazar la hipótesis nula de modo que se concluya
la hipótesis alternativa o de investigación.

El razonamiento empleado por los estadísticos en las pruebas de hipótesis es


similar al método de prueba por contradicción usual en matemáticas. La
hipótesis que el estadístico desea probar es la hipótesis opuesta o sea la
hipótesis nula. Confía entonces en que los datos apoyen el rechazo de H o
porque este rechazo sustenta a la vez la hipótesis alternativa.
Ejemplo 1.

Supongamos que una empresa vende bombillas eléctricas dando una garantía
de 980 horas de duración. El consumidor desea conocer si las bombillas
realmente cumplen la garantía ya que ha observado que algunas de esas
bombillas se han fundido antes de las 980 horas de trabajo.

El consumidor se dispone a efectuar una prueba de hipótesis asumiendo como


hipótesis de investigación que la duración media  de las bombillas es menor
que 980 horas, esto es, H1:  < 980 horas. Por lo tanto, la hipótesis nula tiene
la forma Ho:   980 horas.

La decisión de aceptar o rechazar Ho depende de la información muestral.


Como esta información proviene de un muestreo aleatorio, no podemos tener
una seguridad del ciento por ciento de que la decisión tomada es la correcta.
En otras palabras, podríamos equivocarnos por ejemplo rechazando H o cuando
en realidad esta es la hipótesis verdadera.

Hay cuatro resultados posibles según la decisión que se tome y el valor que
tenga Ho, así:

 Si Ho es verdadero y la aceptamos, tomamos la decisión correcta.

 Si Ho es verdadera y la rechazamos, cometemos un error llamado error


de tipo I.

 Si Ho es falsa y la aceptamos, cometemos un error llamado error de tipo


II

 Si Ho es falsa y la rechazamos, tomamos la decisión correcta.


1.2 Errores de tipo I y de tipo II

Nos interesa analizar las probabilidades de cometer estos errores.

Llamaremos  a la probabilidad de cometer el error tipo I. Esto es:

 = P (rechazar Ho/ Ho es verdadero)

Llamaremos  a la probabilidad de cometer el error Tipo II. Esto es:

 = P (aceptar Ho / Ho es falsa)

Parecería que para contrarrestar estos errores bastaría hacer tanto  como
 lo más pequeños posibles. Pero si tratamos de que  sea pequeña
entonces  crece y lo contrario. No podemos hacer que estos errores tengan
probabilidades pequeñas simultáneamente cuando el tamaño muestral es fijo.
El camino usual a seguir consiste en seleccionar un valor pequeño para ,
digamos 0.001 ó 0.05, y establecer una regla de decisión que nos garantice un
valor pequeño para  . Las reglas de decisión o pruebas estadísticas que
garantizan valores pequeños para  se llaman pruebas potentes.

La potencia de una prueba se mide mediante la probabilidad de rechazar H o


cuando Ho es falsa, entonces la potencia es igual 1-  . En general, una
potencia alta es una característica deseable de las pruebas de hipótesis. Una
de las labores importantes de los estadísticos es la construcción o diseño de
pruebas que ofrezcan potencias altas. Es importante saber que una manera de
mantener pequeñas las probabilidades  y  es aumentando el tamaño de
muestra n pero esto podría resultar demasiado costoso o impracticable según
el tipo de muestra.

1.3 Construcción de la regla de decisión


Las pruebas de hipótesis se inician con la formulación de las hipótesis H o y H1,
luego se selecciona un valor de X o sea el riesgo de equivocarnos que
estamos dispuestos a asumir si aceptamos la hipótesis de investigación siendo
falsa. En tercer lugar debemos establecer una regla de decisión que nos
permita elegir sin ambigüedades una de las dos alternativas sobre Ho.
Volviendo al ejemplo de las bombillas, tenemos que las hipótesis se han
establecido en relación con la media poblacional  y el mejor estimador de 

es x de modo que la regla de decisión estará basada en la distribución x . Si


Ho es verdadera (  0 =980 horas) entonces x tiene una distribución

aproximadamente normal con  0 = 980 y varianza  2 /n para valores grandes

de n (aplicando el teorema central del límite).

La regla de decisión consiste en rechazar Ho si el valor de x para una muestra


aleatoria de bombillas es menor que un valor critico b y aceptarla en el caso
contrario. Construir la regla de decisión es entonces hallar el valor de b tal que

si x  b rechazamos Ho y si
x >b, aceptamos Ho (véase Figura 1).

Sabemos que el valor de x varia de muestra a muestra. Si la población es


aproximadamente normal y  0 = 980, es de esperarse que x tenga un valor
cercano a 980. Que ocurre si tiene un valor menor digamos 970 ¿ Ó 950 ¿ A

partir de que valor podemos asumir que x esta a favor  0 ? El problema de

decisión es el problema de hallar un valor límite b tal que si la media x es


mayor que el se acepta Ho como verdadera y si es menor se considera Ho
como falsa.

Para hallar el valor de b

P(rechazar Ho / Ho es verdadera) = 
 
 x  0 b  0 
p   
   
 n n 

pz  z    , para
b  0  n
z 

Despejamos b de la igualdad anterior y obtenemos
z 
b  0 
n
la regla de decisión para la prueba de hipótesis del ejemplo 1 es la siguiente:
z 
Si x  0  , rechazamos H0
n
z 
Si x  0  , aceptamos H0
n

Región de Región de Aceptación de Ho


Rechazo de
Ho

x  945 b 0  980

figura 1
Supongamos que el consumidor selecciona una muestra aleatoria de 40
bombillas de un lote recibido de esa empresa y encuentra que la duración
promedio por bombilla es de 945 horas y la desviación estándar es de 73
horas. Asumamos también que el máximo riesgo de error si se rechaza Ho es
 = 0.01, es decir, las posibilidades de una decisión incorrecta son de 1 en

100 casos. Para   0.01 , Z0.01 = -2.33. No se conoce  pero como la

muestra es grande (n > 30) podemos remplazar  por S, la desviación


estándar de la muestra, de modo que b = 980 – (2.33) (73) / 40 = 980 – 26.9 =
953.1

tenemos que x = 945 < 953.1, luego se rechaza Ho. Aceptamos que la
duración promedio de las bombillas es inferior a 980 horas ya que los datos
de la muestra están apoyando la conjetura inicial del consumidor.

La regla de decisión puede establecerse también con referencia al valor teórico


Z  leído de las tablas así:

Si z  z se rechaza Ho

Si z > z se acepta Ho

El valor de Z se calcula mediante la formula Z =


x  0  n
s

En el ejemplo anterior, Z =
945  980  40
 3.03 y z  2.33 como
73
Z = -3.03 < - 2.33 entonces rechazamos Ho y la conclusión es la misma
anterior.

1.4 Procedimiento de las pruebas de hipótesis

Las pruebas de hipótesis se efectúan para comparar dos o más poblaciones


directamente o para comparar algunos parámetros de esas poblaciones.
Nosotros nos referiremos únicamente a los parámetros  y  de una
distribución continua (generalmente normal) y al parámetro p de la distribución
binomial.
Representaremos un parámetro cualquiera de los anteriores por la letra  y
un valor fijo de este parámetro por  0
La secuencia para efectuar una prueba de hipótesis, (llamada también
verificación, contraste o test de hipótesis o prueba o test de significación) es la
siguiente:
Primer paso

Establecer las hipótesis estadísticas Ho y H1. Estas hipótesis se establecen en


términos de los parámetros de la población. Se recomienda establecer primero
la hipótesis alternativa H1, o sea aquella hipótesis que alguien desea
corroborar, y luego la hipótesis Ho como la hipótesis excluyente de H1. No
obstante teóricamente es indiferente llamar hipótesis nula a cualquiera de ellas
e hipótesis alternativa a su complementaria debemos tener presente que el
signo igual va asociado con la hipótesis nula para así especificar el riesgo de
rechazar Ho cuando esta es verdadera.

Hay tres formas básicas de establecer estas hipótesis:

a) Ho:    0
H1 es una hipótesis unilateral o de una sola
H1:  <  0 cola a la izquierda. figura 2

b) Ho:    0 H1 es una hipótesis unilateral o de


una sola cola a la derecha figura 3.
H1:  >  0

c) Ho:  =  0 H1 es una hipótesis bilateral o de dos


colas figura 4.
H1 :  ±  0

Segundo Paso:
Seleccionar el valor de  un criterio general consiste en seleccionar para 
un valor de 0.05, 0.01 u otro valor pequeño. Si se elige un valor mayor que 0.10
a veces se requiere justificar dicha elección. La probabilidad  se llama nivel
de significación o nivel de significancia de la prueba ( o sea como la
máxima probabilidad de cometer el error de tipo I y es esta probabilidad
máxima la que se representa por  ).
Cuando rechazamos Ho con un nivel de significancia de 0,05 por ejemplo,
decimos que la prueba es significativa al 5% . Esta es una manera de decir
que, suponiendo verdadera la hipótesis Ho, el resultado experimental obtenido
se presentaría en solo 5 de cada 100 casos suponiendo que el estudio se
repitiera muchas veces. Siendo así, los datos experimentales están en
contradicción con Ho y se inclinan a favor de H1. En el ejemplo 1 la prueba o
el resultado es significativo al 1%, esto es, si  es 980 horas

(Ho verdadera) entonces el resultado x = 945 horas ocurriría por azar solo en
una de cada 100 veces que se realizara este tipo de muestreo.

Este razonamiento nos induce a creer que es más factible la hipótesis H 1


que la hipótesis Ho.

Si el resultado muestral esta a favor de Ho, o sea, si los datos empíricos


concuerdan con la teoría, decimos que ese resultado no es significativo.
Mientras más alejados estén los datos del modelo teórico, más significativos
son los resultados obtenidos.

Tercer paso

Elegir el estadístico apropiado para realizar la prueba. Esta elección


depende del parámetro que se desea comparar. Los parámetros más comunes
son la media  como una medida de tendencia central, la varianza  2
como
una medida de variabilidad y la proporción p como parámetro binomial,

entonces los estadísticos apropiados serán x , S2 y p cuyas distribuciones de


probabilidades son Z, T, X2, F. Una vez elegido el estadístico para la prueba
podemos calcular su valor con base a los resultados de la muestra

Cuarto paso.

Establecer la regla de decisión. En este paso debemos especificar las regiones


de aceptación y de rechazo de la hipótesis Ho. Por ejemplo, si el parámetro es
la media  y n es grande las reglas de decisión para las diferentes hipótesis
del primer paso son como siguen:

Para las hipótesis en:

a) rechazar Ho si x  b y aceptar Ho si x > b en donde b =  0 + Z  S/ n

 b 0
Figura 2

Para las hipótesis en:

b) rechazar Ho Si x  b y aceptar Ho Si x < b, en donde b =  0 +Z1-  S/


n

0 b

Figura 3

Para las hipótesis en: c) rechazar Ho Si x  d1 o x  d2 y aceptar Ho Si d1 < x <


d2, en donde:
z s
d1   0  2
n
z1 s
d 2  0  2
n
Figura4

 
1
2 2

d1 0 d2
Si la muestra es pequeña (n < 30) debe usarse la distribución T en vez de la
distribución Z. Se usa la desviación estándar S en vez de  porque que se
asume que  es desconocida, pero si el valor de  se conoce, este debe
usarse en vez de S.

Quinto paso

Reemplazar los valores numéricos en las formulas, tomar la decisión o


conclusión correspondiente e interpretarla en términos del problema
inicialmente planteado.

Ejemplo 2

La oficina de control de alimentos en una ciudad esta interesada en constatar si


los tarros de jugo de la marca A salen al mercado con el peso real de 20 onzas
que aparece en la etiqueta. Para ello se toma una muestra aleatoria de 30
tarros obteniéndose una media de 18.97 onzas y una desviación estándar de
2.30 onzas. Puede concluir la oficina con esta información, que los tarros salen
al mercado con el peso correcto? Tome  = 0.01

Solución

La oficina de control sospecha que el peso es diferente de 20 onzas, o sea que


la hipótesis de trabajo puede ser:
Ho:  = 20 Vs H1:   20 onzas.

El estadístico de prueba es la media x el cual tiene una distribución Z ya


que n = 30 se considera grande. Se trata de una hipótesis alternativa bilateral
por lo que la regla de decisión es de la forma:

Rechazar Ho Si x  d1 o x  d2 y aceptar Ho si x esta entre d1 y d2, con  =


0.01 y

 = 0.005 leemos en las tablas el valor Z0.005 = - 2.58, luego por


2

simetría,
Z0.995 = 2.58 remplazando estos valores y los del problema en la formula
resulta:
d1 =  0 - Z  / 2 S/ n = 20 – (2.58) (2.3)/ 30 = 18.92

d2 =  0 + Z  / 2 S/ n = 20 + (2.58) (2.3) / 30 = 21.08

la media de la muestra es x = 18.97 que se encuentra entre 18.92 y 21.08 lo


cual nos lleva a aceptar la hipótesis Ho y a concluir que los tarros si tienen el
peso promedio anunciado

la forma equivalente de establecer la regla de decisión es como sigue: rechazar


Ho si Z  Z  / 2 o Z  Z1 -  /2 y aceptarla en el caso contrario.

Tenemos que Z = ( x -  0 ) n /S = (18.97 -20) 30 /2.3 = - 2.45

Puesto que – 2.58< -2.45 entonces aceptamos H0 y llegamos a la misma

conclusión anterior

También podría gustarte