Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2012
1 Tests de hipótesis
En muchas ocasiones, el propósito de una investigación es determinar si es
verdadera o no, alguna hipótesis sobre algún parámetro. Los métodos que se
utilizan para esto se llaman pruebas o tests de hipótesis.
Una hipótesis estadística es una expresión acerca del valor de una o varias
características o parámetros de la población. Comenzaremos viendo algunos
test de hipótesis acerca de la media de una población.
Ejemplo 1.1 Se realizan 6 mediciones de una misma muestra con una téc-
nica cuyo un error de medición tiene = 0:08mg=ml: Se quiere saber si el
verdadero valor del especimen que está midiendo es mayor que 1:22g=ml
Debemos notar que al decidirnos por una de las dos hipótesis, podemos
cometer dos tipos de errores diferentes. Podemos equivocarnos al concluir
que > 1:22 cuando en realidad no lo es (error de tipo I : rechazar H0 cuando
es verdadera), o concluir que = 1:22, cuando en realidad es mayor que
1:22 (error de tipo II : aceptar H0 cuando es falsa). Recordemos que nunca
conocemos cuánto vale , y sólo podemos hacer inferencias, basadas en la
muestra, acerca de su valor.
2
Los procedimientos que vamos a ver, nos permiten acotar la probabilidad
de cometer un error de tipo I, por eso es importante saber cuál debe ser la
hipótesis nula y cuál la alternativa.
Lo más natural será calcular el promedio de las 6 mediciones x y com-
pararlo con el valor 1:22, ya que sabemos que X es un estimador de ; si
x resulta mucho más grande que 1:22; tendremos motivos para pensar que
en realidad > 1:22 (cuánto más grande sea x; mayor será la evidencia
contra H0 : = 1:22 a favor de HA : > 1:22). Debemos decidir cuándo
consideraremos que x es lo su…cientemente “grande ”como para rechazar la
hipótesis nula. Para esto debemos considerar un estadístico con distribución
conocida cuando H0 es verdadera y de…nir una zona de rechazo. Usaremos
el estadístico de prueba:
X 1:22
Z= p
0:08= 6
que tiene distribución N(0; 1) cuando = 1:22 (cuando H0 es verdadera)
Se puede establecer una regla de decisión como la siguiente: rechazar H0
cuando el valor del estadístico de prueba es mayor que 1:65; de este modo
nos aseguramos que
p
P (errorde tipo I) = P 6 X 1:22 =0:08 > 1:65 j H0 verdadera = 0:05
3
También podemos razonar de esta manera: si fuera = 1:22, ¿cuál es la
probabilidad de obtener una media muestral tan grande o más que el valor
1:28?, o lo que es equivalente, ¿cuál es la probabilidad de que el estadístico de
prueba alcanzara un valor mayor o igual que 1:84?. Esta probabilidad puede
calcularse ya que el estadístico de prueba tiene distribución N(0; 1) cuando
= 1:22 y es
p
PH0 6 X 1:22 =0:08 > 1:84 j H0 verdadera =
=1 (1:84) = 1 0:9671 = 0:0329
Esto es lo que se llama el “valor-p”, cuánto menor sea este p; más evi-
dencia tengo contra H0 : En nuestro ejemplo, p = 0:0329 es una probabilidad
bastante pequeña, podemos rechazar H0 y a…rmar la alternativa, es decir que
> 1:22
Otra manera de expresar la regla de decisión, es decir que se rechaza H0 ,
cuando el “valor-p” es menor que : En realidad el “valor-p” es el menor
nivel de signi…cación (el más exigente) para el cual se puede rechazar H0 con
los valores observados.
En este caso “valor-p”= 0:0329, esto signi…ca que podemos rechazar H0
hasta con un nivel 0:0329
Tratemos de resumir los principales conceptos que hemos visto hasta aquí.
4
los valores mayores que un punto crítico; en el caso HA : < 0 la zona
de rechazo son los valores menores que un punto crítico; y en el caso
HA : 6= 0 la zona de rechazo es bilateral, es decir está formada por
la unión de valores a la derecha y a la izquierda de dos puntos críticos.
5
Podemos modelizar esta situación como sigue, tenemos una m.a. X1 ; X2 ; ::; X10
donde cada Xi es el perímetro cefálico del i-ésimo niño medido y Xi tiene
distribución N( ; 1:972 ), y el problema a resolver es
H0 : = 36 HA : < 36
X 36
Z= p
1:97= n
ahora, la regla de decisión es:
p
n (x 36)
rechazar H0 : = 36 a favor de HA : < 36; cuando < z
6
los niños con HC di…ere del valor medio de la población general. Se sabe que
la distribución de tallas para niños sanos de esa edad, es normal con media
68.2 cm y desviación típica 2.34 cm. En este caso se puede suponer que la
distribución de tallas de los niños con HC también es normal con la misma
desviación típica.
Tenemos una m.a. X1 ; X2 ; ::; X13 donde cada Xi es la talla del i-ésimo
niño medido y Xi v N( ; 2:342 )
En este caso no hay una hipótesis a priori de que las tallas de los niños
con HC son mayores o menores que las de la población general (68:2), es por
eso que la alternativa debe ser HA : 6= 68:2:
Decimos que este es un test bilateral, en general el problema se expresa:
H0 : = 68:2 HA : 6= 68:2
7
este “valor-p”no brinda su…ciente evidencia para rechazar H0
Se debe observar que los test bilaterales son más conservadores que los
unilaterales, para un mismo valor del estadístico de prueba, el valor-p es
mayor para un test bilateral que para un test unilateral.
Podemos resumir lo que hemos visto sobre test para la media , cuando la
muestra X1 ; X2 ; :::; Xn proviene de una distribución normal con conocido.
Hipótesis nula: H0 : = 0 p
Valor de estadístico de prueba: z = n (x 0) =
Hipótesis alternativa Región de rechazo para un nivel
HA : > 0 z>z
HA : < 0 z< z
HA : 6= 0 z > z =2 o z < z =2
X
T = p 0 tiene distribución de Student con n 1grados de libertad
S= n
Usaremos entonces este estadístico de prueba, del mismo modo que antes
usamos el Z.
8
Ejemplo 1.4 Se desea estudiar si el nivel de aluminio en la sangre en la
población de niños que reciben antiácidos con aluminio, di…ere de la población
general de niños que no reciben estos antiácidos. La distribución de los nive-
les de aluminio en sangre es aproximadamente normal; además el nivel medio
de aluminio en sangre en la población de niños que no reciben antiácidos es
de 4:13 g=l: Se seleccionó una muestra de diez niños que reciben este tipo
de antiácidos, y se obtuvo x = 37:20 g=l y s = 7:13 g=l
H0 : = 4:13 HA : 6= 4:13
9
estándar. Se sabe por investigaciones previas que estos últimos tienen una
presión sistólica cuya distribución es normal con media de 130 mm Hg; y
puede suponerse que para los individuos tratados con la nueva droga la dis-
tribución también es normal con media desconocida. Se desea probar que
esta media es menor que el valor 0 = 130: Se seleccionan 26 individuos
con hipertensión, se les administra la nueva droga, y se obtiene una media
muestral de x = 121:5 mm Hg y una desviación s = 19.2.
10
Realice los ejercicios 5 y 6
Ejemplo 1.6 Consideremos los datos del ejemplo ??, supongamos que se
sabe que la concentración media de zinc en el hígado de esa especie de peces,
que viven en una área libre de contaminación es de 8.2 g=g, pero se de-
sconoce la forma de esa distribución. ¿ Se puede a…rmar, en base a estos
datos, que los peces examinados tienen niveles de zinc mayores que ese valor
esperado?
X 8:2
Z= p
S= n
ya que, según ese teorema, cuando = 8:2 tiene una distribución aproxi-
madamente N(0; 1).
Entonces podemos de…nir, como siempre, una regla de decisión:
p
n (x 8:2)
rechazar H0 : = 8:2 a favor de HA : > 8:2; cuando >z
s
con los datos del ejemplo, x = 9:15p g=g y s = 1:27 g=g, reemplazando en
el estadístico, obtenemos un valor 56 (9:15 8:2) =1:27 = 5:59, vemos en la
tabla de la distribución normal que el valor-p = P (Z > 5:59) < 0:0001, esto
signi…ca que hay muy fuerte evidencia para rechazar H0 ; y se puede rechazar
con cualquier nivel de signi…cación razonable.
Podemos resumir el caso test para la media de una distribución descono-
cida, cuando n es grande:
11
Hipótesis nula: H0 : = 0 p
Valor del estadístico de prueba: z = n (x 0 ) =s
Hipótesis alternativa Región de rechazo para un nivel (aproximado)
HA : > 0 z>z
HA : < 0 z< z
HA : 6= 0 z > z =2 o z < z =2
H0 : = 0 HA: 6= 0
P 0 2 IC(1 ) =1
rechazar H0 cuando 0 2
= IC(1 )
12
Si estamos interesados en saber si la verdadera concentración es 53 g=ml,
debemos construir un test para:
H0 : = 53 HA: 6= 53
rechazo H0 si 53 2
= IC(1 )
13
Práctica 7
(a) Plantee el test de hipótesis, indique cuales son los errores de tipo
I y tipo II para el problema planteado.
(b) Calcule el p-valor
(c) ¿Cuál sería su conclusión usando un nivel 0:01?
14
5. Considerando los datos del ejercicio 9 de la Práctica 5, si se sabe que
el valor real del suero es 245,
6. Un artículo reporta los siguientes valores para ‡ujo térmico del suelo
de 8 terrenos cubiertos por polvo de carbón:
La media de ‡ujo térmico del suelo para terrenos cubiertos sólo con
pasto es 29.0 Si se supone que la diistribción de ‡ujo térmico es normal,
¿sugier la información que el polvo de arbón es e…caz para aumentar
la media de ‡ujo térmico sobre la del pasto?
15
muestral fue de 0.42 mg. Otra investigación anterior indicaba que el ve-
radero promedio de cantidad neutralizante era de 1.75 mg/g d toxina.
¿Contradice la nueva información el valor sugerido por el investigador
anterior?
16
(c) ¿Cuál es la probabilidad de que no se considere necesaria la reca-
libración cuando de hecho = 10:1? ¿Cuándo = 9:8?
p
(d) Sea z = (x 10) =( = n): ¿Para qué valor c, es la región de
rechazo de la parte (b) equivalente a la región bilateral jzj > c?
(e) Vuelva a expresar el procedimiento de prueba de la parte
p (b) en
términos del estadístico de prueba Z = X 10 =( = n)
11. Con los datos del ejercicio 3, ¿cuál es la probabilidad de no poder probar
que la media del punto de fusión es menor que 95 cuando en realidad
es 94? ¿cómo se llama este tipo de error?
17