Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Contrastes PDF
Contrastes PDF
Contraste de hip
otesis
Terminamos esta intrusion en la inferencia estadstica con este tercer metodo.
Con frecuencia, el problema planteado no es simplemente la estimacion de un parametro, sino el
dise
no de una regla de decision sobre la aceptacion o rechazo de cierta armacion realizada sobre la
poblacion estudiada. Estableceremos entonces un contraste, prueba o test de hipotesis, cuyo objetivo
sera decidir, con alguna medida sobre con que seguridad, la veracidad de la armacion, o hipotesis
marcada. De forma esquematica, el problema se plantea en las etapas siguientes:
tesis nula y denotaremos H0 , y frente a ella
a) Se establece una hipotesis, que llamaremos hipo
tesis alternativa.
otra hipotesis H1 , o hipo
b) Se realiza un experimento aleatorio para el que se sabe que si H0 es cierta, la probabilidad de
que ocurra cierto suceso S es peque
na.
ocurre S, se rechaza H0 ;
c) Si al realizar el experimento
no ocurre S, se acepta H0 .
La justicacion esta en el hecho de que sabemos que de ser cierta H0 , S es de probabilidad peque
na,
luego si ha ocurrido S se ha dado un suceso bastante improbable, o bien H0 es falsa.
Los contrastes de hipotesis se clasican en parametricos y no parametricos. En los primeros ocurre
que al determinar el valor de un parametro, la distribucion poblacional queda determinada. En otro
caso, estaremos ante un contraste de hipotesis no parametrico.
En las primeras secciones nos dedicaremos a los contrastes parametricos, aunque parte del lenguaje
es com
un a ambos.
1.
Conceptos b
asicos
Supongamos que se conoce que cierta poblacion X sigue una distribucion dada por una funcion
de masa P (o funcion de densidad f ), donde . Sea (X1 . . . XN ) una muestra aleatoria de X.
Supongamos dada una particion del espacio parametrico:
= 0 1
en dos subconjuntos mutuamente excluyentes.
99
CAPITULO 6. CONTRASTE DE HIPOTESIS
100
Denici
on 1.1. Un test para contrastar la hipotesis nula H0 : 0 frente a la hipotesis alternativa
H1 : 1 , consiste en decidir, para cada posible muestra, si aceptamos o rechazamos H0 . Por lo
tanto, un test consistir
a en dividir el espacio muestral (conjunto de todas las posibles muestras) en
dos regiones: una regi
on crtica R, o de rechazo de H0 ; y una region A, de aceptacion de H0 .
El problema esta en como tomar esta decision de la manera menos erronea posible. Observese
que con un test se pueden cometer, basicamente, dos tipos de errores:
Error de tipo I : rechazar H0 cuando no se debe (H0 es cierta)
Error de tipo II: aceptar H0 cuando no se debe (H0 es falsa).
La siguiente funcion nos da una medida de cada uno de estos errores:
n de potencia de un test con region crtica R, para contrastar H0 :
Denici
on 1.2. La funcio
0 frente a H1 : 1 , es la funcion que a cada le hace corresponder el valor
P (R) = P ( rechazar H0 ) .
Con este nuevo concepto, es claro que nos interesara que la funcion de potencia tome valores:
na probabilidad de error tipo I;
proximos a 0 siempre que 0 : peque
proximos a 1 siempre que 1 : peque
na probabilidad de error tipo II.
Lo que se suele hacer es exigir que la funcion de potencia no supere cierto valor, peque
no, cuando
0 ; y procurar, despues, que sea lo mayor posible cuando 1 .
n (o tama
Denici
on 1.3. El nivel de significacio
no) de un test con region crtica R, para
contrastar H0 : 0 frente a H1 : 1 , es el valor
= max P (R) .
0
1. CONCEPTOS BASICOS
1.1.
101
Test de raz
on de verosimilitudes
El metodo mas utilizado para la construccion de tests razonables para contrastar H0 frente a H1
es el metodo de razon de verosimilitudes. Exponemos a continuacion la idea, que es muy sencilla
e intuitiva, en el caso discreto (para el continuo, basta sustituir la funcion de masa por funcion de
densidad).
Supongamos que X es una poblacion con funcion de masa P . Para cada posible muestra,
(x1 . . . xn ), se considera el siguiente cociente:
max P (x1 . . . xn )
0
(cociente de verosimilitudes) .
max P (x1 . . . xn )
max P (x1 . . . xn )
0
R = (x1 . . . xn ) :
c
max P (x1 . . . xn )
= max 0 P (R) .
frente a
H1 : = 0
al nivel de signicacion .
En segundo lugar queremos estudiar el cociente entre dos verosimilitudes maximas: con 0 ,
para el numerador; y en todo el espacio parametrico, , para el denominador. La verosimilitud que
cada muestra, (x1 . . . xn ), tiene en esta poblacion, X N ( ; ), es:
1
1
2
exp 2
f (x1 . . . xn ) =
(xi ) .
2
( 2 )n ()n
CAPITULO 6. CONTRASTE DE HIPOTESIS
102
Ahora bien, los maximos de estas verosimilitudes se alcanzan en los valores correspondientes a
los estimadores de maxima verosimilitud. Concretamente, tenemos:
el valor max f (x1 . . . xn ) se alcanza en el estimador de maxima verosimilitud
= x
1
(xi x)2
=
n i=1
2
es decir:
1
n
2
exp
(xi x)
max f (x1 . . . xn ) =
2 (xi x)2
( 2 )n [ n1
(xi x)2 ]n/2
n
1
exp
= n
2
2
2 ]n/2
[
(x
)
i
n
2 =
1
(xi 0 )2
n i=1
y por tanto:
1
n
2
exp
(xi 0 )
max f (x1 . . . xn ) =
0
2 (xi 0 )2
( 2 )n [ n1
(xi 0 )2 ]n/2
n
1
exp
= n
2
2
2 ]n/2
[
(x
)
i
0
n
n/2
n/2
max f (x1 . . . xn )
(xi x)2
(xi x)2
0
=
=
max f (x1 . . . xn )
(xi 0 )2
(xi x + x 0 )2
n/2
n/2
(xi x)2
1
=
=
n
x0 )2
x 0 )2
(xi x)2 + n(
1+
x)2
xi
Unas u
ltimas manipulaciones a esta expresion nos llevan a la igualdad:
n/2
n/2
max f (x1 . . . xn )
1
1
0
=
=
=
2
n
x0 )2
0)
max f (x1 . . . xn )
1+
1 + 1 x
2
x)2
xi
n1
s /n
1+
1
n1
0
s/ n
n/2
n/2
max f (x1 . . . xn )
1
0
R = (x1 . . . xn ) :
c
c =
(x1 . . . xn ) :
2
max f (x1 . . . xn )
x
1
0
1 + n1 s/ n
x
x 2
0
0 c1 =
(x1 . . . xn ) : c2
= (x1 . . . xn ) :
s/ n
s/ n
1. CONCEPTOS BASICOS
103
x 0
= max P (R) = max P (R) = max P c2
=0
=0
0
s/ n
x 0
tn1
s/ n
y as:
c2 = tn1 ; /2
En denitiva, hemos obtenido que la region crtica para contrastar la hipotesis nula H0 : = 0
frente a la hipotesis alternativa, H1 : = 0 , al nivel de signicacion es:
s
R = (x1 . . . xn ) : |
x 0 | tn1 ; /2
n
Observaciones. Un par de consideraciones respecto a este test.
a) Esta muy ligado a la estimacion por intervalos de conanza.
En efecto, la region de aceptacion de este test es:
A=
=
(x1 . . . xn ) : |
x 0 | < tn1 ; /2
(x1 . . . xn ) : x tn1 ; /2
s
s
< 0 < x + tn1 ; /2
n
n
x tn1 ; /2 .
Por otra parte, este es un intervalo de conanza, a nivel 1, para estimar la media poblacional,
, de una poblacion X N ( ; ), con desconocida.
CAPITULO 6. CONTRASTE DE HIPOTESIS
104
Con desarrollos analogos al del ejemplo, se obtienen los test de razon de verosimilitudes para
otros contrastes, que presentamos en la seccion 2. Su aplicacion a situaciones reales pasa por decidir,
en primer lugar, que test se ajustara mejor al problema, as como el nivel de signicacion a jar para
rechazar la hipotesis nula. Es importante, por tanto, observar ciertas consideraciones sobre como
hacer estas elecciones.
Elecci
on de hip
otesis nula
Como ya se ha indicado, los tests son bastante conservadores con la hipotesis nula, siendo, en
particular, asimetrico el papel de esta y la hipotesis alternativa. En las situaciones mas frecuentes,
nos encontraremos ante uno de los dos siguientes problemas:
a) Se quiere contrastar = 0 y = 0 . En este caso, tenemos una clara asimetra en la particion
del espacio parametrico, y siempre se toma como hipotesis nula H0 : = 0 .
b) Mas problematica es la eleccion de hipotesis nula cuando se quiere contrastar < 0 frente a
> 0 . Debido a la tendencia conservadora del test para la hipotesis nula, tomaremos como
hipotesis alternativa aquella para la que necesitemos que la evidencia muestral sea suciente
como para aceptarla. En otras palabras, tomaremos como hipotesis alternativa aquella que
deseemos probar estadsticamente. Esto no resuelve todas las situaciones posibles, pues no
siempre estara claro que es lo que se quiere probar estadsticamente.
Elecci
on del nivel de signicaci
on
El nivel se elige en base a lo serias que se consideren las consecuencias de rechazar equivocadamente H0 (o, lo que es lo mismo, de aceptar equivocadamente H1 ). Cuanto mas desastrosas se
consideren las consecuencias de esta posible equivocacion, mas peque
no se debera tomar el nivel de
signicacion. Los niveles de signicacion mas extendidos son:
0.10 ;
0.05 ;
0.01 .
El pvalor
El pvalor de una muestra para contrastar H0 frente a H1 se puede denir como:
la probabilidad evaluada bajo H0 ) de obtener un resultado menos
compatible con la hipotesis nula que el proporcionado por la muestra
obtenida.
De esta manera podemos interpretar el pvalor de una muestra como el apoyo que los datos
aportan a H0 . Si este pvalor se encuentra por debajo del nivel de signicacion elegido, se tendra un
escaso apoyo a H0 , y deberemos rechazar la hipotesis nula. Si, por el contrario, el pvalor de una
muestra esta por encima del nivel de signicacion elegido, hay suciente apoyo a la hipotesis nula y
esta puede ser aceptada.
El calculo del pvalor de una muestra no es sencillo, y se sale del cometido de este curso. Hay
programas informaticos que lo realizan, pero aqu nos limitaremos a saber interpretarlo si, de alguna
manera, nos lo hacen saber.
FRECUENTES
2. TEST DE HIPOTESIS
MAS
2.
105
Test de hip
otesis m
as frecuentes
= nivel de signicacion del contraste.
n = tama
no de la muestra.
1.- X N ( )
H0 : = 0 conocida)
H0 : = 0 desconocida)
H0 : 0 conocida)
H0 : 0 desconocida)
H0 : 0 conocida)
H0 : 0 desconocida)
H0 = hipotesis nula.
R = region crtica o de rechazo de H0 .
R = |
x 0 | > z/2 n
R = |
x 0 | > tn1;/2 sn
R = x 0 > z n
R = x 0 > tn1; sn
R = x 0 < z1 n
R = x 0 < tn1;1 sn
H0 : = 0
R=
H0 : 0
R=
H0 : 0
R=
n1
02
n1
02
n1
02
s2
/ 2n1;1/2 2n1;/2
s2 > 2n1;
s2 < 2n1;1
p0 1p0 )
H0 : p = p 0
R = |
x p0 | > z/2
n
p0 1p0 )
H0 : p p 0
R = x p0 > z
n
p0 1p0 )
H0 : p p 0
R = x p0 < z1
n
3.- X P () (muestras grandes)
H 0 : = 0
R = |
x 0 | > z/2 0 /n
H 0 : 0
R = x 0 > z 0 /n
H 0 : 0
R = x 0 < z1 0 /n
CAPITULO 6. CONTRASTE DE HIPOTESIS
106
4.- Dos poblaciones Normales independientes
R=
|
x y| > z/2
12
n1
22
n2
R = |
x y| > tn1 +n2 2;/2 sp n11 +
2
s1
s22
R = |
x y| > tf ;/2 n1 + n2
R=
x y > z
12
n1
22
n2
2
s1
s22
R = x y > tf ; n1 + n2
R=
x y < z1
12
n1
22
n2
1
n2
2
s1
s22
R = x y < tf ;1 n1 + n2
1
n2
1
n2
R = s21 /s22
/ Fn1 1;n2 1;1/2 Fn1 1;n2 1;/2
R = {s21 /s22 > Fn1 1;n2 1; }
H0 : p1 = p2
R = |
x y| > z/2 p (1 p) n11 + n12
1
1
H0 : p1 p2
R = x y > z p (1 p) n1 + n2
1
1
H0 : p1 p2
R = x y < z1 p (1 p) n1 + n2
3. CONTRASTES
107
H1 : A > B
1
1
+
R = xA xB > tn +nB 2; sp
nA nB
Calculos:
nA + nB 2 = 15 + 17 2 = 30
t30;0.05 = 1.701
(nA 1) s2A + (nB 1) s2B
14 81 + 16 110.25
s2p =
=
nA + nB 2
30
1134 + 1764
2898
=
=
= 96.6
30
30
sp 9.83
1
32
1
+
=
0.3542
15 17
255
1
1
t30;0.05 sp
+
5.9224
15 17
xA xB = 400 385 = 15
Podemos decir, entonces, que se tiene la suciente evidencia muestral para aceptar que el nuevo
proceso B requiere menos caucho para la misma produccion.
3.
Contrastes 2
Hasta ahora siempre hemos supuesto que la muestra aleatoria, (X1 . . . Xn ), proceda de una
poblacion X con cierto modelo de probabilidad, del que desconocamos el valor del parametro .
Nos podemos, por contra, encontrar ante el problema de desconocer el tipo de modelo que sigue la
poblacion. Cuando las hipotesis se realizan sobre el modelo, y no solo sobre alg
un parametro, nos
encontramos con los contrastes de validacion del modelo, que son contrastes no parametricos.
En los 3 tipos de problemas que vamos a analizar, realizaremos contrastes de hipotesis. En la
descripcion de la region crtica apareceran ciertos estadsticos que seguiran, aproximadamente, una
distribucion 2 de Pearson (de aqu el ttulo de la seccion).
CAPITULO 6. CONTRASTE DE HIPOTESIS
108
3.1.
Supongamos que X es una variable aleatoria de la que suponemos sigue cierta distribucion determinada por P . Dada una muestra aleatoria, (X1 . . . Xn ), de la misma, queremos ver si, a la vista
de la muestra, es razonable admitir que la distribucion de X es la enunciada. Por tanto, se quieren
contrastar las hipotesis:
H0 : el modelo de probabilidad de X es P
H1 : el modelo de probabilidad de X no es P
Para realizar el contraste se toma una particion (arbitraria) del espacio muestral de la poblacion
(posibles valores de X) en k clases, A1 , . . . , Ak . Para cada Ai (i = 1 . . . k) se consideran las
siguientes frecuencias (absolutas):
Oi = frecuencia observada en Ai = numero de elementos de la muestra que se han situado en Ai
ei = frecuencia esperada en la clase Ai si la hipotesis nula es cierta
De estas, las primeras, al ser frecuencias observadas, se obtienen de la muestra. Para las frecuencias
esperadas, ei , observese que cada Ai ocurrira con probabilidad P (Ai ) si suponemos cierta la hipotesis
nula. Ahora bien, el suceso Ai solo puede ocurrir, o no ocurrir, de manera que
P (Ai ) = la probabilidad de que ocurra Ai , en cada observacion, si H0 es cierta
y as, en las n observaciones, esta frecuencia esperada, ei , es la esperanza de una B(n; P (Ai )):
ei = nP (Ai ) .
La idea de este tipo de contraste (debida a Pearson), es evaluar las diferencias existentes entre
frecuencias observadas y esperadas, y establecer un valor a partir del cual se considera que las mismas
son sucientemente signicativas para rechazar el modelo.
El estadstico que se utiliza para realizar el contraste es:
k
(Oi ei )2
i=1
ei
Si la hipotesis nula es cierta (el modelo es el adecuado), este estadstico (para n sucientemente
grande), sigue una 2t de Pearson con t, igual a
k 1 grados de libertad si el modelo especica completamente
las probabilidades de cada Ai antes de elegir la muestra
k r 1 grados de libertad si es preciso estimar r parametros
para obtener las probabilidades de cada Ai .
En caso de tener que realizarse, se usan los estimadores de maxima verosimilitud para los parametros.
Denotaremos por 20 a este estadstico. Fijado el nivel de signicacion, , se obtiene el valor 2t;
(t = k 1 o k r 1) tal que P (2t > 2t; ) = , y se adopta la siguiente regla de decision:
si 20 =
(Oi ei )2
i=1
ei
3. CONTRASTES
109
F
ormula para el c
alculo del estadstico. Para el calculo de 20 se suele utilizar la siguiente
identidad:
k
k
(Oi ei )2 Oi2
20 =
=
n.
ei
ei
i=1
i=1
Ejercicio 2 Demostrar la formula anterior.
n:
Solucio
20
(Oi ei )2
i=1
ei
=
=
O2 2Oi ei + e2
i
i=1
k
i=1
Oi = n, y que
i=1
ei
O2
i
i=1
ei
2
k
Oi +
i=1
O2
Oi2
i
2n + n
P (Ai ) =
n
ei
e
i
i=1
i=1
ei
i=1
P (Ai ) = 1.
i=1
Ejemplo 44 Caso 1) Para estudiar si un dado es simetrico se ha lanzado 120 veces, obteniendo
el 1, 20 veces; el 2, 30 veces; el 3, 15 veces; el 4, 25 veces; el 5, 22 veces y el 6, 8 veces. Contrastese
la hipotesis de simetra al nivel de signicacion = 0.05.
n: La hipotesis de simetra armara que el modelo de probabilidad que sigue la variable
Solucio
X =resultado al lanzar el dado, viene dado por la funcion de masa P con
P (X = 1) = P (X = 2) = P (X = 3) = P (X = 4) = P (X = 5) = P (X = 6) =
1
.
6
(Oi ei )2
i=1
ei
ei
20
20
20
20
20
20
Oi e i
0
10
-5
5
2
-12
(Oi ei )2
0
100
25
25
4
144
Oi ei )2
ei
0
5
1.25
1.25
0.2
7.2
20 = 14.9
CAPITULO 6. CONTRASTE DE HIPOTESIS
110
e1.4625 (1.4625)xi
.
xi
En la siguiente tabla recogemos, con dos decimales, los datos que nos llevan al calculo del es2
i)
.
tadstico 20 = Oi e
ei
xi
0
1
2
3
4
5
Oi
17
31
18
8
4
2
ei
18.53
27.10
19.82
9.66
3.53
1.03
O i ei
-1.53
3.9
-1.82
-1.66
0.47
0.97
(Oi ei )2
2.34
15.21
3.31
2.76
0.22
0.94
Oi ei )2
ei
0.13
0.56
0.17
0.29
0.06
0.91
20 = 2.12
Para determinar la regla de decision, se considera una 2 con 6 1 1 = 4 grados de libertad,
pues se ha estimado 1 parametro. Al nivel de signicacion marcado, = 0.05, se tiene 24;0.05 = 9.488.
Puesto que 2.12 < 9.488 se acepta la hipotesis de que el modelo de Poisson es apropiado para describir
la variable X, al nivel 0.05 de signicacion.
3.2.
3. CONTRASTES
111
En la realizacion de este contraste, tomamos una particion (arbitraria) del espacio muestral com
un
a las r poblaciones en k clases A1 . . . Ak . Para cada clase Ai (i = 1 . . . k) se consideran
Oij = frecuencia observada en Ai en la muestra jesima
eij = frecuencia esperada en la clase Ai con la muestra jesima, si la hipotesis nula es cierta
= nj P (Aj ) .
As las cosas, para la muestra jesima
k
(Oij eij )2
2
2k1
0j =
e
ij
i=1
(Oij eij )2
2
2
00 =
0j =
2rk1) .
e
ij
j=1
j=1 i=1
Sin embargo, nos queda un problema por resolver: no conocemos la distribucion P que sigue X.
Normalmente, solo se quiere contrastar si el comportamiento de X es homogeneo en todas las
poblaciones, pero no cual es ese comportamiento (que distribucion concreta sigue). Por tanto, tenemos
que estimar P (Ai ) (i = 1 . . . k), y lo hacemos a partir de las observaciones mediante:
r
j=1 Oij
P
(Ai ) =
(i = 1 . . . k)
n1 + + nr
Denotemos por n la suma de todos los tama
nos muestrales: n = n1 + + nr . Con la estimacion
adoptada para cada P (Ai ), las frecuencias esperadas seran:
r
j=1 Oij
eij = nj P (Ai ) = nj
n
Una formula mas simetrica, y quiza mas facil de recordar, para el calculo de las frecuencias eij ,
se obtiene observando que: la suma de todas las frecuencias observadas en una misma poblacion,
k
no muestral de esa poblacion, nj . As, podemos calcular eij con
i=1 Oij , debe coincidir con el tama
la expresion:
k
r
(Oij eij )2
=
eij
j=1 i=1
CAPITULO 6. CONTRASTE DE HIPOTESIS
112
k
r
(Oij eij )2
> 2r1)k1); .
e
ij
j=1 i=1
F
ormula para el c
alculo del estadstico. Como en el caso anterior, se suele utilizar la siguiente
identidad para el calculo del estadstico:
200 =
r
r
k
k
2
O12 = 10;
O13 = 15;
O21 = 21;
O22 = 20;
O23 = 9
j=1
n2 =
j=1
n = n1 + n2 = 40 + 50 = 90 = total de encuestados
F = a favor,
C = en contra,
A = abstencion
2
Oi1
O11 + O21
15 + 21
36
P
(F ) = i=1
=
=
=
90
90
90
2 n
O
+
O
O
10
+
20
30
i2
12
22
P
(C) = i=1
=
=
=
n
90
90
90
2
O
+
O
O
15
+
9
24
i3
13
23
P
(A) = i=1
=
=
=
n
90
90
90
36 30
90 66
24
o tambien: P
(A) = 1 P
(F ) P
(C) = 1
=
=
90 90
90
90
3. CONTRASTES
113
Oij
2
00 =
n
eij
j=1 i=1
2
3
2
Oij
j=1 i=1
eij
n=
3 2
O1j
j=1
2
O11
e1j
2
O2j
90
+
e2j
2
2
2
2
2
O21
O12
O22
O13
O23
+
+
+
+
90
e11
e21
e12
e22
e13
e23
225 3 100 3 225 441 3 400 3 81
=
+
+
+
+
+
90
16
40
32
20
50
40
= 94.78125 90 = 4.78125
Ahora bien, para una 2 con (31)(21) = 2 grados de libertad y = 0.05 resulta que 22;0.05 = 5.991.
Como el valor del estadstico, 4.78125, es menor que 5.991 = 22;0.05 , aceptamos (al nivel 0.05)
la hipotesis nula, es decir, que la opinion sobre la ley citada se distribuye homogeneamente entre
solteros y casados.
3.3.
Contraste de independencia
Supongamos ahora que se quiere estudiar si dos caractersticas, X e Y , de una poblacion estan o no
relacionadas. Para este estudio, se recogen datos muestrales de ambas caractersticas conjuntamente,
obteniendo una muestra de datos agrupados:
(X1 Y1 ) . . . (Xn Yn ) .
Lo que se pretende es ver si, a la vista de la muestra, tiene sentido admitir que X e Y son independientes. Contrastaremos, pues, las hipotesis:
H0 : = X e Y son independientes
H1 : = X e Y no son independientes.
Como en casos anteriores, se toma una particion (arbitraria) del espacio muestral, en este caso,
para la variable (X Y ). Para ello, partimos el espacio muestral de X (posibles valores de X) en
k clases, A1 . . . Ak ; y el de Y en r clases B1 . . . Br . Estas particiones nos dan una particion del
espacio muestral de (X Y ) en k r clases:
A1 B1 . . . A1 Br A2 B1 . . . A2 Br . . . . . . Ak B1 . . . Ak Br .
CAPITULO 6. CONTRASTE DE HIPOTESIS
114
Sean, ahora:
P (Ai ) =
;
P (Bj ) = i=1
n
n
de manera que, las frecuencias esperadas si H0 fuera cierta, tomando estas estimaciones, seran:
k
r
r
k
Oij
Oij
Oij
O
ij
j=1
j=1
i=1
i=1
(Ai )P
(Bj ) = n
eij = nP
=
.
n
n
n
Se toma el estadstico:
k
r
(Oij eij )2
2
00 =
eij
j=1 i=1
que sigue, cuando H0 es cierta, aproximadamente (para n grande) una distribucion 2 con
rk 1 (k 1) (r 1) = (r 1)(k 1) grados de libertad.
Como se puede observar, el estadstico anterior coincide con el utilizado para el contraste de homogeneidad, aunque tiene un origen distinto. En este caso, se han estimado k 1 de las k probabilidades
P (Ai ), para i = 1 . . . k, y r 1 de las r probabilidades P (Bj ), para j = 1 . . . r.
Finalmente, se rechazara la hipotesis de independencia (H0 ), al nivel de signicacion si:
200 =
r
k
(Oij eij )2
> 2r1)k1); .
e
ij
j=1 i=1
para la caracterstica X;
para la caracterstica Y .
3. CONTRASTES
115
2
2
(Oij eij )2
eij
j=1 i=1
O11 = 23 ;
P
(N H) =
P
(H) =
200
200
77 97
123 97
e11 = nP
(N F )P
(H) =
(F )P
(H) =
e21 = nP
200
200
77
103
123 103
e12 = nP
(N F )P
(N H) =
(F )P
(N H) =
e22 = nP
200
200
Utilizando la formula de la seccion precedente para el estadstico, se obtiene:
200 =
2
2
2
Oij
j=1 i=1
eij
n=
2
2
2
2
O11
O21
O12
O22
+
+
+
200
e11
e21
e12
e22
Para decidir, a nivel de signicacion 0.05, comparamos este valor con 2t; 0.05 para una 2 con
t = (21)(21) = 1 grado de libertad: 21; 0.05 = 3.841. Como el estadstico toma un valor superior, hemos
de rechazar H0 , y se concluye (al 0.05 de signicacion) que hay dependencia entre la hipertension y
el habito de fumar.
Problemas
Contrastes param
etricos
1. Se sabe que una vacuna es efectiva contra cierta enfermedad en el 25 % de los casos. Para decidir
si una nueva vacuna es mas efectiva, se administra a 10 personas y se adopta la siguiente regla
de decision:
si el n
umero de personas protegidas es mayor que 4 se admite la nueva
vacuna.
CAPITULO 6. CONTRASTE DE HIPOTESIS
116
3. Una empresa fabrica cuerdas cuya resistencia media a la rotura es de 300 kg., con desviacion
tpica 24 kg. Una muestra de 64 cuerdas fabricadas mediante un nuevo proceso dio una resistencia media de 310 kg. La compa
na desea estudiar si, efectivamente, el nuevo proceso da
mejores resultados que el antiguo. Realizar dicho estudio, con niveles de signicacion 0.10, 0.05
y 0.01.
4. La longitud media de los ejes fabricados por una compa
na es 7.05 mm con desviacion tpica
0.15 mm. Una muestra de tama
no 36, seleccionada como control del proceso, dio una media de
6.95 mm. Cabe esperar, a partir de este dato, que hay alg
un fallo en el proceso de produccion?
(Tomese nivel de signicacion = 0.05.)
5. Se ha aplicado un test de memoria a un gran n
umero de estudiantes, encontrandose desviaciones
tpicas de 33.5 para los alumnos y de 38.2 para las alumnas. Aplicando el test a 38 alumnos
y 45 alumnas se obtuvieron puntuaciones medias de 165.4 y 176.6 respectivamente. Se puede
asegurar, al nivel de conanza = 0.05, que el resultado del test de memoria es independiente
del sexo?
6. Una muestra de 200 bombillas de la marca A dio una vida media de funcionamiento de 2280
horas con desviacion tpica de 80 horas. Otra muestra de 180 bombillas de la marca B dio
vida media 2320 horas con desviacion tpica 100 horas. Se puede armar, al nivel 0.01, que es
mayor la vida media para la marca B?
7. Un laboratorio de farmacia arma que un producto que elabora es efectivo para aliviar cierta
molestia en no menos del 90 % de los casos en 12 horas. Ese medicamento recetado a una
muestra aleatoria de 300 personas enfermas dio buen resultado, al cabo de 12 horas, en 240
casos. Se puede aceptar al nivel de signicacion 0.01 que la armacion del laboratorio es
correcta?
8. Se sabe que cierto medicamento es efectivo en el alivio de cierta dolencia en el 60 % de los
casos. Los resultados experimentales sobre un medicamento nuevo administrado a una muestra
de 144 personas que sufran esa dolencia, muestran 100 casos con alivio. Se puede concluir, al
nivel 0.05, que el nuevo medicamento es mas efectivo que el antiguo.
9. Un fabricante de cierto artculo produce dos marcas del mismo. En una muestra de 200 consumidores, 64 haban consumido la primera marca, y en otra muestra de 120, 22 haban consumido la
segunda. Se puede armar que existe preferencia signicativa por la primer marca? Nivel 0.01 .
10. Una fabrica dispone de una seccion dedicada a empaquetar los artculos producidos, trabajando
en turnos de ma
nana y tarde. La experiencia ha demostrado que la distribucion del tiempo de
empaquetado de un artculo es aproximadamente normal en los dos turnos. Una muestra de
20 tiempos de empaquetado del turno de ma
nana (M) dio cuasivarianza 5.2 minutos y otra de
3. CONTRASTES
117
16 tiempos del turno de tarde (T) dio cuasivarianza 6.4 minutos. Contrastese la hipotesis nula
2
2
M
T2 frente a la alternativa M
> T2 , al nivel 0.01 .
11. Un fabricante de pilas electricas arma que la vida de la pilas que fabrica esta distribuida de
forma normal con desviacion tpica 0.8 meses. Se selecciona una muestra de 16 pilas resultando
una desviacion tpica muestral de 0.85.
a) Se puede asegurar al nivel 0.05 que > 0.8?
b) Una muestra de 10 pilas de otro fabricante dio cuasivarianza 0.70. Se puede concluir al
nivel 0.02 que la varianza para las dos marcas es la misma?
12. Se considera buena la edicion de un libro si el n
umero medio de erratas por pagina no supera
el 0.1 (H0 ). Dadas las pruebas de imprenta, se eligen 10 paginas al azar, y se rechazan las
pruebas si se observan 2 o mas erratas. Se supone que el n
umero de erratas por pagina sigue
una Poisson.
Que nivel de signicacion tiene el contraste? Con que probabilidad aceptaremos un libro si
realmente tiene una media de 0.2 erratas por pagina?
13. En una piscifactora se desea contrastar la hipotesis (H0 ) de que el porcentaje de peces adultos
que miden menos de 20 cm. es, como maximo, del 10 %. Para ello, se va a tomar una muestra
de 6 peces, y rechazaremos H0 si encontramos mas de un pez con longitud inferior a 20 cm.
a) Cual es el nivel de signicacion de este contraste?
b) Calcular la potencia del contraste si en realidad hay un 20 % de peces que miden menos
de 20 cm.
14. La concentracion media de dioxido de carbono en el aire en una cierta zona no es habitualmente
mayor que 355 p.p.m.v. (partes por millon en volumen). Se sospecha que esta concentracion es
mayor en la capa de aire mas proxima a la supercie. Para contrastar esta hipotesis se analiza
el aire en 20 puntos elegidos aleatoriamente a una misma altura cerca del suelo. Resulto una
media muestral de 580 p.p.m.v y una cuasidesviacion tpica muestral de 180. Suponiendo
normalidad para las mediciones, proporcionan estos datos suciente evidencia estadstica, al
nivel 0.01, a favor de la hipotesis de que la concentracion es mayor cerca del suelo? Indicar
razonadamente si el pvalor es mayor o menor que 0.01 .
15. Se van a probar dos medicamentos, A y B, contra una enfermedad. Para esto, tratamos 100
ratones enfermos con A y otros 100 con B. El n
umero medio de horas que sobreviven con A es
x = 1 200, y el n
umero medio con B es y = 1 400. Suponiendo normalidad en ambos casos, se
pide:
a) Para
= 0.10, se puede aceptar igualdad de varianzas si sabemos que
y (yi y)2 = 950 000?
(xi
x)2 = 900 000
CAPITULO 6. CONTRASTE DE HIPOTESIS
118
16. Con objeto de estudiar si las pulsaciones en los hombres pueden considerarse menores que en las
mujeres, se tomaron muestras de 16 hombres y 16 mujeres, obteniendose los siguientes datos:
Hombres (X): 74 77 71 76 79 74 83 79 83 72 79 77 81 79 84 80
Mujeres (Y): 81 84 80 73 78 80 82 84 80 84 75 82 79 82 79 85
Que se puede decir al respecto?
17. Se tienen algunos indicios de que el consumo de tabaco tiende a provocar problemas de trombosis debidos a un aumento en la capacidad de coagulacion. Para estudiar esta hipotesis, Levine
(1973) extrajo muestras de sangre de 11 individuos antes y despues de que fumasen un cigarrillo y midio la capacidad de agregacion de las plaquetas, obteniendo los datos siguientes
(correspondientes al maximo porcentaje de plaquetas que se agregaron despues de haber sido
sometidas a un estmulo adecuado):
Antes:
25 25 27 44 30 67 53 53 52 60 28
Despues: 27 29 37 56 46 82 57 80 61 59 43
Hay suciente evidencia estadstica (al nivel de signicacion 0.01) a favor de la hipotesis de que
los fumadores presentan mayor tendencia a la formacion de coagulos? Indicar las condiciones
que se requieren para que el test utilizado sea valido.
Contrastes
18. Se sabe que en cierta provincia durante un a
no dado han nacido 7423 ni
nos y 7043 ni
nas.
Es aceptable la hipotesis de igualdad de probabilidad de nacimiento de ni
no y ni
na en esa
provincia? Utilcese el nivel de signicacion 0.05 .
19. Una muestra aleatoria de 3839 observaciones de una poblacion en la que se ha clasicado a los
individuos en cuatro tipos A, B, C y D ha dado las siguiente composicion:
Tipo A
1997
Tipo B
906
Tipo C
904
Tipo D
32
Lunes
105
Martes
89
Miercoles
102
Jueves
92
Viernes
132
21. Con objeto de contrastar la hipotesis de igual probabilidad de nacimiento de hijo que de hija,
se estudiaron 200 familias de cuatro hijos con los siguientes resultados:
n
umero de hijos varones
n
umero de familias
4
13
3
52
2
90
1
39
0
6
3. CONTRASTES
119
Frecuencia
5
18
42
27
8
23. En Espa
na, los tantos por ciento de personas de los grupos sanguneos O, A, B y AB son,
respectivamente, 39, 44, 13 y 4. Se selecciona una muestra de 200 individuos de una poblacion
situada en una zona monta
nosa con malos accesos, resultando 71 personas del grupo O, 69 del
A, 41 del B y 19 del AB. Contrastese, al nivel 0.01, si estos resultados concuerdan con los dados
para Espa
na.
24. Se han aplicado a tres grupos de pacientes tratamientos distintos A, B y C, obteniendose los
resultados de la tabla para el n
umero de pacientes con recada.
A
B
C
Contrastese al nivel del 5 % si pueden considerarse homogeneos los resultados obtenidos para
los tres tratamientos.
25. Despues de lanzar un dado 500 veces, se ha obtenido la siguiente tabla de frecuencias:
xi
ni
1
76
2
83
3
90
4
78
5
99
6
74
p 12 p2 + pq
siendo q = 1 p = la proporcion en la poblacion de genes que provocan el daltonismo.
A partir de la muestra, se ha estimado que q = 0.087. Concuerdan los datos con el modelo?
27. Una fabrica de automoviles quiere averiguar si la preferencia de modelo tiene relacion con
el sexo de los clientes. Se toman dos muestras aleatorias de 1000 hombres y 1000 mujeres,
observandose las siguientes preferencias:
Modelo
Sexo
A
B
C
Son homogeneas las preferencias entre hombres y
mujeres,
al nivel de signicacion 0.01?
Mujer
340 400 260
Hombre 350 270 380