Contrastes PDF

Captulo 6
Contraste de hip
otesis
Terminamos esta intrusion en la inferencia estadstica con este tercer metodo.
Con frecuencia, el problema planteado no es simplemente la estimacion de un parametro, sino el
dise
no de una regla de decision sobre la aceptacion o rechazo de cierta armacion realizada sobre la
poblacion estudiada. Estableceremos entonces un contraste, prueba o test de hipotesis, cuyo objetivo
sera decidir, con alguna medida sobre con que seguridad, la veracidad de la armacion, o hipotesis
marcada. De forma esquematica, el problema se plantea en las etapas siguientes:
tesis nula y denotaremos H0 , y frente a ella
a) Se establece una hipotesis, que llamaremos hipo
tesis alternativa.
otra hipotesis H1 , o hipo
b) Se realiza un experimento aleatorio para el que se sabe que si H0 es cierta, la probabilidad de
que ocurra cierto suceso S es peque
na.
ocurre S, se rechaza H0 ;
c) Si al realizar el experimento
no ocurre S, se acepta H0 .
La justicacion esta en el hecho de que sabemos que de ser cierta H0 , S es de probabilidad peque
na,
luego si ha ocurrido S se ha dado un suceso bastante improbable, o bien H0 es falsa.
Los contrastes de hipotesis se clasican en parametricos y no parametricos. En los primeros ocurre
que al determinar el valor de un parametro, la distribucion poblacional queda determinada. En otro
caso, estaremos ante un contraste de hipotesis no parametrico.
En las primeras secciones nos dedicaremos a los contrastes parametricos, aunque parte del lenguaje
es com
un a ambos.
1.
Conceptos b
asicos
Supongamos que se conoce que cierta poblacion X sigue una distribucion dada por una funcion
de masa P (o funcion de densidad f ), donde . Sea (X1 . . . XN ) una muestra aleatoria de X.
Supongamos dada una particion del espacio parametrico:
= 0 1
en dos subconjuntos mutuamente excluyentes.
99

CAPITULO 6. CONTRASTE DE HIPOTESIS
100
Denici
on 1.1. Un test para contrastar la hipotesis nula H0 : 0 frente a la hipotesis alternativa
H1 : 1 , consiste en decidir, para cada posible muestra, si aceptamos o rechazamos H0 . Por lo
tanto, un test consistir
a en dividir el espacio muestral (conjunto de todas las posibles muestras) en
dos regiones: una regi
on crtica R, o de rechazo de H0 ; y una region A, de aceptacion de H0 .
El problema esta en como tomar esta decision de la manera menos erronea posible. Observese
que con un test se pueden cometer, basicamente, dos tipos de errores:
Error de tipo I : rechazar H0 cuando no se debe (H0 es cierta)
Error de tipo II: aceptar H0 cuando no se debe (H0 es falsa).
La siguiente funcion nos da una medida de cada uno de estos errores:
n de potencia de un test con region crtica R, para contrastar H0 :
Denici
on 1.2. La funcio
0 frente a H1 : 1 , es la funcion que a cada le hace corresponder el valor
P (R) = P ( rechazar H0 ) .
Con este nuevo concepto, es claro que nos interesara que la funcion de potencia tome valores:
na probabilidad de error tipo I;
proximos a 0 siempre que 0 : peque
proximos a 1 siempre que 1 : peque
na probabilidad de error tipo II.
Lo que se suele hacer es exigir que la funcion de potencia no supere cierto valor, peque
no, cuando
0 ; y procurar, despues, que sea lo mayor posible cuando 1 .
n (o tama
Denici
on 1.3. El nivel de significacio
no) de un test con region crtica R, para
contrastar H0 : 0 frente a H1 : 1 , es el valor
= max P (R) .
0
(Es decir, la maxima probabilidad de cometer el error de tipo I).

As, se ja cierto nivel de signicacion , peque
no, y se exige al test que no lo supere. De esta
manera, se esta acotando la maxima probabilidad de error tipo I. Con esta manera de proceder, vemos
que los papeles de las hipotesis nula y alternativa, no son simetricos. El hecho de que acotemos la
maxima probabilidad de error tipo I, por un valor proximo a cero, hace que difcilmente rechacemos
H0 cuando no se debe. Como consecuencia, los tests de hipotesis que usamos habitualmente, tienden
a ser muy conservadores con la hipotesis nula. Por supuesto, la decision se toma a partir de una
muestra, y por tanto, este tipo de tests necesitan que la evidencia muestral en contra de H0 sea
sucientemente fuerte para rechazarla.

1. CONCEPTOS BASICOS
1.1.
101
Test de raz
on de verosimilitudes
El metodo mas utilizado para la construccion de tests razonables para contrastar H0 frente a H1
es el metodo de razon de verosimilitudes. Exponemos a continuacion la idea, que es muy sencilla
e intuitiva, en el caso discreto (para el continuo, basta sustituir la funcion de masa por funcion de
densidad).
Supongamos que X es una poblacion con funcion de masa P . Para cada posible muestra,
(x1 . . . xn ), se considera el siguiente cociente:
max P (x1 . . . xn )
0
(cociente de verosimilitudes) .
max P (x1 . . . xn )

Si este cociente es peque

no, se considera poco plausible (a la vista de la muestra obtenida) que el
verdadero valor de este en 0 . En este caso, lo mas razonable es rechazar H0 . Si, por el contrario, el
cociente es grande, lo mas razonable es aceptar H0 . La eleccion del punto crtico que separe la region
de rechazo de H0 (cocientes peque
nos), de la de aceptacion (cocientes grandes), se realiza jando un
determinado nivel de signicacion .
Denici
on 1.4. El test de raz
on de verosimilitudes para contrastar H0 : 0 frente a H1 : 1 ,
al nivel de signicaci
on , es el que tiene como region crtica:
max P (x1 . . . xn )
0
R = (x1 . . . xn ) :
c
max P (x1 . . . xn )

donde c se obtiene de la condici

on:
= max 0 P (R) .
Ejercicio 1 Escribir la denicion correspondiente al caso de una poblacion continua.

El uso extendido de estos tests se debe al hecho de que, para poblaciones normales, quedan
reducidos a reglas muy sencillas (y muy relacionadas con los intervalos de conanza), como muestra
el siguiente ejemplo.
Ejemplo 42 Supongamos que (X1 . . . XN ) es una muestra aleatoria de una poblacion con distribucion N ( ; ), donde los dos par
ametros son desconocidos. Se quiere realizar un contraste de hipotesis
sobre el posible valor de la media poblacional, . Concretamente, vamos a realizar el test de razon de
verosimilitudes para contrastar:
H 0 : = 0
frente a
H1 : = 0
al nivel de signicacion .
Primeramente, observese como se divide el espacio parametrico al realizar estas hipotesis:

= { =( ) : > 0}
0 = {( ) ; = 0 }
1 = {( ) ; = 0 }
En segundo lugar queremos estudiar el cociente entre dos verosimilitudes maximas: con 0 ,
para el numerador; y en todo el espacio parametrico, , para el denominador. La verosimilitud que
cada muestra, (x1 . . . xn ), tiene en esta poblacion, X N ( ; ), es:
1
1
2
exp 2
f (x1 . . . xn ) =
(xi ) .
2
( 2 )n ()n

102
Ahora bien, los maximos de estas verosimilitudes se alcanzan en los valores correspondientes a
los estimadores de maxima verosimilitud. Concretamente, tenemos:
el valor max f (x1 . . . xn ) se alcanza en el estimador de maxima verosimilitud

= x
1
(xi x)2
=
n i=1
2
es decir:
1
n
2
exp
(xi x)
max f (x1 . . . xn ) =

2 (xi x)2
( 2 )n [ n1
(xi x)2 ]n/2
n
1
exp
= n
2
2
2 ]n/2
[
(x
)
i
n
el valor max f (x1 . . . xn ) se alcanza en el estimador de maxima verosimilitud

0
2 =
1
(xi 0 )2
n i=1
y por tanto:
1
n
2
exp
(xi 0 )
max f (x1 . . . xn ) =
0
2 (xi 0 )2
( 2 )n [ n1
(xi 0 )2 ]n/2
n
1
exp
= n
2
2
2 ]n/2
[
(x
)
i
0
n
As el cociente de maximas verosimilitudes sera:
n/2
n/2
max f (x1 . . . xn )
(xi x)2
(xi x)2
0
=
=
max f (x1 . . . xn )
(xi 0 )2
(xi x + x 0 )2

n/2
n/2
(xi x)2
1
=
=
n
x0 )2
x 0 )2
(xi x)2 + n(
1+
x)2
xi
Unas u
ltimas manipulaciones a esta expresion nos llevan a la igualdad:
n/2
n/2
max f (x1 . . . xn )
1
1
0
=
=
=
2
n
x0 )2
0)
max f (x1 . . . xn )
1+
1 + 1 x
2

x)2
xi
n1
s /n
1+
1
n1
0
s/ n
n/2
para el cociente de verosimilitudes maximas, donde s2 es la cuasivarianza muestral.

De esta manera, la regi
on crtica sera de la forma:
n/2
max f (x1 . . . xn )
1
0
R = (x1 . . . xn ) :
c
c =
(x1 . . . xn ) :
2
max f (x1 . . . xn )
x
1
0
1 + n1 s/ n

x
x 2
0
0 c1 =
(x1 . . . xn ) : c2
= (x1 . . . xn ) :
s/ n
s/ n

1. CONCEPTOS BASICOS
103
El valor de c2 se obtiene imponiendo que el test tenga nivel de signicacion :
x 0
= max P (R) = max P (R) = max P c2
=0
=0
0
s/ n
Ahora bien, en este caso sabemos que
x 0
tn1
s/ n
y as:
c2 = tn1 ; /2
En denitiva, hemos obtenido que la region crtica para contrastar la hipotesis nula H0 : = 0
frente a la hipotesis alternativa, H1 : = 0 , al nivel de signicacion es:
s
R = (x1 . . . xn ) : |
x 0 | tn1 ; /2
n
Observaciones. Un par de consideraciones respecto a este test.
a) Esta muy ligado a la estimacion por intervalos de conanza.
En efecto, la region de aceptacion de este test es:
A=
=
(x1 . . . xn ) : |
x 0 | < tn1 ; /2
(x1 . . . xn ) : x tn1 ; /2
s
s
< 0 < x + tn1 ; /2
n
n
Podemos decir, entonces, que este test para contrastar H0 : = 0 frente a H1 : = 0 , al

nivel de signicacion , acepta la hipotesis nula siempre que, realizada una muestra, 0 sea
un valor en el intervalo
x tn1 ; /2 .
Por otra parte, este es un intervalo de conanza, a nivel 1, para estimar la media poblacional,
, de una poblacion X N ( ; ), con desconocida.
En denitiva, nuestro test de razon de verosimilitudes, con nivel de signicacion , rechaza la

hipotesis nula, H0 : = 0 , siempre que 0 no este en el correspondiente intervalo de conanza
(al nivel de conanza 1 ) para .
b) El funcionamiento del test es muy razonable.
Se quiere estimar , y tomamos su estimador de maxima verosimilitud, la media muestral x.
La hipotesis nula arma la igualdad = 0 , de manera que es razonable esperar que x este proxima a 0 . El alejamiento permitido para seguir aceptando la hipotesis nula dependera del tama
no
muestral y del nivel de signicacion . El test de razon de verosimilitudes nos ja el maximo
alejamiento permitido, y as:
s
rechazaremos H0 si |
x 0 | tn1 ; /2 .
n

104
Con desarrollos analogos al del ejemplo, se obtienen los test de razon de verosimilitudes para
otros contrastes, que presentamos en la seccion 2. Su aplicacion a situaciones reales pasa por decidir,
en primer lugar, que test se ajustara mejor al problema, as como el nivel de signicacion a jar para
rechazar la hipotesis nula. Es importante, por tanto, observar ciertas consideraciones sobre como
hacer estas elecciones.
Elecci
on de hip
otesis nula
Como ya se ha indicado, los tests son bastante conservadores con la hipotesis nula, siendo, en
particular, asimetrico el papel de esta y la hipotesis alternativa. En las situaciones mas frecuentes,
nos encontraremos ante uno de los dos siguientes problemas:
a) Se quiere contrastar = 0 y = 0 . En este caso, tenemos una clara asimetra en la particion
del espacio parametrico, y siempre se toma como hipotesis nula H0 : = 0 .
b) Mas problematica es la eleccion de hipotesis nula cuando se quiere contrastar < 0 frente a
> 0 . Debido a la tendencia conservadora del test para la hipotesis nula, tomaremos como
hipotesis alternativa aquella para la que necesitemos que la evidencia muestral sea suciente
como para aceptarla. En otras palabras, tomaremos como hipotesis alternativa aquella que
deseemos probar estadsticamente. Esto no resuelve todas las situaciones posibles, pues no
siempre estara claro que es lo que se quiere probar estadsticamente.
Elecci
on del nivel de signicaci
on
El nivel se elige en base a lo serias que se consideren las consecuencias de rechazar equivocadamente H0 (o, lo que es lo mismo, de aceptar equivocadamente H1 ). Cuanto mas desastrosas se
consideren las consecuencias de esta posible equivocacion, mas peque
no se debera tomar el nivel de
signicacion. Los niveles de signicacion mas extendidos son:
0.10 ;
0.05 ;
0.01 .
El pvalor
El pvalor de una muestra para contrastar H0 frente a H1 se puede denir como:
la probabilidad evaluada bajo H0 ) de obtener un resultado menos
compatible con la hipotesis nula que el proporcionado por la muestra
obtenida.
De esta manera podemos interpretar el pvalor de una muestra como el apoyo que los datos
aportan a H0 . Si este pvalor se encuentra por debajo del nivel de signicacion elegido, se tendra un
escaso apoyo a H0 , y deberemos rechazar la hipotesis nula. Si, por el contrario, el pvalor de una
muestra esta por encima del nivel de signicacion elegido, hay suciente apoyo a la hipotesis nula y
esta puede ser aceptada.
El calculo del pvalor de una muestra no es sencillo, y se sale del cometido de este curso. Hay
programas informaticos que lo realizan, pero aqu nos limitaremos a saber interpretarlo si, de alguna
manera, nos lo hacen saber.

FRECUENTES
2. TEST DE HIPOTESIS
MAS
2.
105
Test de hip
otesis m
as frecuentes
= nivel de signicacion del contraste.
n = tama
no de la muestra.
1.- X N ( )
H0 : = 0 conocida)
H0 : = 0 desconocida)
H0 : 0 conocida)
H0 : 0 desconocida)
H0 : 0 conocida)
H0 : 0 desconocida)
H0 = hipotesis nula.
R = region crtica o de rechazo de H0 .
R = |
x 0 | > z/2 n
R = |
x 0 | > tn1;/2 sn
R = x 0 > z n
R = x 0 > tn1; sn
R = x 0 < z1 n
R = x 0 < tn1;1 sn
H0 : = 0
R=
H0 : 0
R=
H0 : 0
R=
n1
02
n1
02
n1
02
s2
/ 2n1;1/2 2n1;/2
s2 > 2n1;
s2 < 2n1;1
2.- X B(1 p) (muestras grandes)
p0 1p0 )
H0 : p = p 0
R = |
x p0 | > z/2
n
p0 1p0 )
H0 : p p 0
R = x p0 > z
n
p0 1p0 )
H0 : p p 0
R = x p0 < z1
n
3.- X P () (muestras grandes)
H 0 : = 0
R = |
x 0 | > z/2 0 /n
H 0 : 0
R = x 0 > z 0 /n
H 0 : 0
R = x 0 < z1 0 /n

106
4.- Dos poblaciones Normales independientes
s2p y f calculados como en los intervalos de conanza)

H0 : 1 = 2 1 2 conocidas)
H0 : 1 = 2 1 = 2 )
H0 : 1 = 2 1 = 2 )
H0 : 1 2 1 2 conocidas)
H0 : 1 2 1 = 2 )
H0 : 1 2 1 = 2 )
H0 : 1 2 1 2 conocidas)
H0 : 1 2 1 = 2 )
H0 : 1 2 1 = 2 )
H0 : 1 = 2
H0 : 1 2
H0 : 1 2
R=
|
x y| > z/2
12
n1
22
n2
R = |
x y| > tn1 +n2 2;/2 sp n11 +
2
s1
s22
R = |
x y| > tf ;/2 n1 + n2
R=
x y > z
12
n1
22
n2
R = x y > tn1 +n2 2; sp n11 +
2
s1
s22
R = x y > tf ; n1 + n2
R=
x y < z1
12
n1
22
n2
1
n2
R = x y < tn1 +n2 2;1 sp n11 +
2
s1
s22
R = x y < tf ;1 n1 + n2
1
n2
1
n2
R = s21 /s22
/ Fn1 1;n2 1;1/2 Fn1 1;n2 1;/2
R = {s21 /s22 > Fn1 1;n2 1; }
R = {s21 /s22 < Fn1 1;n2 1;1 }
5.- Comparacion de proporciones (muestras grandes e independientes)
X B(1 p1 ), (X1 . . . Xn1 ) m.a.s. de X

n1 x + n2 y
i xi +
i yi
=
p =
n1 + n2
n 1 + n2
Y B(1 p2 ), (Y1 . . . Yn2 ) m.a.s. de Y
H0 : p1 = p2
R = |
x y| > z/2 p (1 p) n11 + n12
1
1
H0 : p1 p2
R = x y > z p (1 p) n1 + n2
1
1
H0 : p1 p2
R = x y < z1 p (1 p) n1 + n2
3. CONTRASTES
107
Ejemplo 43 Una fabrica viene utilizando un proceso A en la elaboracion de un artculo a base de

caucho. Se acaba de descubrir un nuevo proceso B de fabricacion del mismo artculo que parece que
requiere menos caucho. Para decidir si es cierto se selecciona una muestra de nA = 15 artculos
fabricados por proceso A y otra de nB = 17 fabricados por el proceso B. La cantidad de caucho
utilizada para cada muestra, en gramos, dio como resultado xA = 400, sA = 9, xB = 385, sB = 10.5.
Supongase que la cantidad de caucho utilizada sigue, en ambos casos, una distribucion normal con
la misma varianza. A la vista de estas muestras, que decision se tomara con nivel de signicaci
on
= 0.05?
n: Puesto que el interes esta en probar que la cantidad de caucho utilizada por el proceso
Solucio
B es menor que la utilizada por el A, se contrastaran las siguientes hipotesis:
H0 : A B ;
H1 : A > B
siendo XA N (A ; ) y XB N (B ; ), con desconocida. En este caso la region de rechazo es:
1
1
+
R = xA xB > tn +nB 2; sp
nA nB
Calculos:
nA + nB 2 = 15 + 17 2 = 30
t30;0.05 = 1.701
(nA 1) s2A + (nB 1) s2B
14 81 + 16 110.25
s2p =
=
nA + nB 2
30
1134 + 1764
2898
=
=
= 96.6
30
30
sp 9.83
1
32
1
+
=
0.3542
15 17
255
1
1
t30;0.05 sp
+
5.9224
15 17
xA xB = 400 385 = 15
Podemos decir, entonces, que se tiene la suciente evidencia muestral para aceptar que el nuevo
proceso B requiere menos caucho para la misma produccion.
3.
Contrastes 2
Hasta ahora siempre hemos supuesto que la muestra aleatoria, (X1 . . . Xn ), proceda de una
poblacion X con cierto modelo de probabilidad, del que desconocamos el valor del parametro .
Nos podemos, por contra, encontrar ante el problema de desconocer el tipo de modelo que sigue la
poblacion. Cuando las hipotesis se realizan sobre el modelo, y no solo sobre alg
un parametro, nos
encontramos con los contrastes de validacion del modelo, que son contrastes no parametricos.
En los 3 tipos de problemas que vamos a analizar, realizaremos contrastes de hipotesis. En la
descripcion de la region crtica apareceran ciertos estadsticos que seguiran, aproximadamente, una
distribucion 2 de Pearson (de aqu el ttulo de la seccion).

108
3.1.
Contrastes de la bondad del ajuste
Supongamos que X es una variable aleatoria de la que suponemos sigue cierta distribucion determinada por P . Dada una muestra aleatoria, (X1 . . . Xn ), de la misma, queremos ver si, a la vista
de la muestra, es razonable admitir que la distribucion de X es la enunciada. Por tanto, se quieren
contrastar las hipotesis:
H0 : el modelo de probabilidad de X es P
H1 : el modelo de probabilidad de X no es P
Para realizar el contraste se toma una particion (arbitraria) del espacio muestral de la poblacion
(posibles valores de X) en k clases, A1 , . . . , Ak . Para cada Ai (i = 1 . . . k) se consideran las
siguientes frecuencias (absolutas):
Oi = frecuencia observada en Ai = numero de elementos de la muestra que se han situado en Ai
ei = frecuencia esperada en la clase Ai si la hipotesis nula es cierta
De estas, las primeras, al ser frecuencias observadas, se obtienen de la muestra. Para las frecuencias
esperadas, ei , observese que cada Ai ocurrira con probabilidad P (Ai ) si suponemos cierta la hipotesis
nula. Ahora bien, el suceso Ai solo puede ocurrir, o no ocurrir, de manera que
P (Ai ) = la probabilidad de que ocurra Ai , en cada observacion, si H0 es cierta
y as, en las n observaciones, esta frecuencia esperada, ei , es la esperanza de una B(n; P (Ai )):
ei = nP (Ai ) .
La idea de este tipo de contraste (debida a Pearson), es evaluar las diferencias existentes entre
frecuencias observadas y esperadas, y establecer un valor a partir del cual se considera que las mismas
son sucientemente signicativas para rechazar el modelo.
El estadstico que se utiliza para realizar el contraste es:
k
(Oi ei )2
i=1
ei
Si la hipotesis nula es cierta (el modelo es el adecuado), este estadstico (para n sucientemente
grande), sigue una 2t de Pearson con t, igual a
k 1 grados de libertad si el modelo especica completamente
las probabilidades de cada Ai antes de elegir la muestra
k r 1 grados de libertad si es preciso estimar r parametros
para obtener las probabilidades de cada Ai .
En caso de tener que realizarse, se usan los estimadores de maxima verosimilitud para los parametros.
Denotaremos por 20 a este estadstico. Fijado el nivel de signicacion, , se obtiene el valor 2t;
(t = k 1 o k r 1) tal que P (2t > 2t; ) = , y se adopta la siguiente regla de decision:
si 20 =
(Oi ei )2
i=1
ei
> 2t; se rechaza el modelo.
3. CONTRASTES
109
F
ormula para el c
alculo del estadstico. Para el calculo de 20 se suele utilizar la siguiente
identidad:
k
k
(Oi ei )2 Oi2
20 =
=
n.
ei
ei
i=1
i=1
Ejercicio 2 Demostrar la formula anterior.
n:
Solucio
20
(Oi ei )2
i=1
ei
=
=
O2 2Oi ei + e2
i
i=1
k
i=1
pues es evidente que
Oi = n, y que
i=1
ei
O2
i
i=1
ei
2
k
Oi +
i=1
O2
Oi2
i
2n + n
P (Ai ) =
n
ei
e
i
i=1
i=1
ei
i=1
P (Ai ) = 1.
i=1
Ejemplo 44 Caso 1) Para estudiar si un dado es simetrico se ha lanzado 120 veces, obteniendo
el 1, 20 veces; el 2, 30 veces; el 3, 15 veces; el 4, 25 veces; el 5, 22 veces y el 6, 8 veces. Contrastese
la hipotesis de simetra al nivel de signicacion = 0.05.
n: La hipotesis de simetra armara que el modelo de probabilidad que sigue la variable
Solucio
X =resultado al lanzar el dado, viene dado por la funcion de masa P con
P (X = 1) = P (X = 2) = P (X = 3) = P (X = 4) = P (X = 5) = P (X = 6) =
1
.
6
Contrastaremos, pues, las siguientes hipotesis:

H0 : el dado es simetrico (P (1) = P (2) = P (3) = P (4) = P (5) = P (6) = 1/6)
H1 : el dado no es simetrico.
Utilizamos el contraste 2 , calculando el valor del estadstico
20 =
(Oi ei )2
i=1
que seguira una distribucion 2

evaluar el estadstico:
xi
1
2
3
4
5
6
ei
con 6 1 = 5 grados de libertad. La siguiente tabla nos ayuda a

Oi
20
30
15
25
22
8
ei
20
20
20
20
20
20
Oi e i
0
10
-5
5
2
-12
(Oi ei )2
0
100
25
25
4
144
Oi ei )2
ei
0
5
1.25
1.25
0.2
7.2
20 = 14.9
Observese que ei = nP (X = xi ) = 120 16 = 20 para todos los resultados.

Por otra parte, 25;0.05 = 11.070, y como 14.9 > 11.070, la muestra obtenida nos permite concluir
que el dado no es simetrico, al nivel de signicacion 0.05 .

110
umero X de llamadas telefonicas recibidas por minuto en una centralita

Ejemplo 45 Caso 2) El n
es una variable aleatoria cuya distribucion puede ser una Poisson. Se realizan 80 experiencias de un
minuto, obteniendose los siguientes resultados:
xi = n
umero de llamadas 0 1 2 3 4 5
ni = frecuencia
17 31 18 8 4 2
Calc
ulese la media muestral x y utilcese un contraste 2 para estudiar al nivel 0.05 si es aceptable
la hipotesis de que la variable X sigue una distribucion de Poisson de parametro = x.
n:
Solucio
1
0 + 31 + 36 + 24 + 16 + 10
117
x =
(ni xi ) =
=
= 1.4625 .
80
80
80
Se quiere, ahora, realizar un contraste con hipotesis nula
H0 : X Poisson (1.4625)
de manera que las frecuencias esperadas seran:
ei = 80
e1.4625 (1.4625)xi
.
xi
En la siguiente tabla recogemos, con dos decimales, los datos que nos llevan al calculo del es2
i)
.
tadstico 20 = Oi e
ei
xi
0
1
2
3
4
5
Oi
17
31
18
8
4
2
ei
18.53
27.10
19.82
9.66
3.53
1.03
O i ei
-1.53
3.9
-1.82
-1.66
0.47
0.97
(Oi ei )2
2.34
15.21
3.31
2.76
0.22
0.94
Oi ei )2
ei
0.13
0.56
0.17
0.29
0.06
0.91
20 = 2.12
Para determinar la regla de decision, se considera una 2 con 6 1 1 = 4 grados de libertad,
pues se ha estimado 1 parametro. Al nivel de signicacion marcado, = 0.05, se tiene 24;0.05 = 9.488.
Puesto que 2.12 < 9.488 se acepta la hipotesis de que el modelo de Poisson es apropiado para describir
la variable X, al nivel 0.05 de signicacion.
3.2.
Contraste de homogeneidad de poblaciones
Supongamos que estamos interesados en estudiar si cierta caracterstica X, se comporta de igual

manera en r poblaciones. Tomaramos muestras de la misma, de manera independiente, en las r
poblaciones. Tendramos, pues, r muestras independientes, con sus correspondientes tama
nos muestrales, digamos n1 n2 . . . nr , que podemos presentar como:
(X11 . . . X1n1 ) . . . (Xr1 . . . Xrnr ) .
Para decidir sobre esta cuestion se contrastan las hipotesis:
H0 : X se distribuye homogeneamente en las r poblaciones: X P
H1 : X no se distribuye homogeneamente en las r poblaciones.
3. CONTRASTES
111
En la realizacion de este contraste, tomamos una particion (arbitraria) del espacio muestral com
un
a las r poblaciones en k clases A1 . . . Ak . Para cada clase Ai (i = 1 . . . k) se consideran
Oij = frecuencia observada en Ai en la muestra jesima
eij = frecuencia esperada en la clase Ai con la muestra jesima, si la hipotesis nula es cierta
= nj P (Aj ) .
As las cosas, para la muestra jesima
k
(Oij eij )2
2
2k1
0j =
e
ij
i=1
aproximadamente para nj grande, como vimos en el contraste anterior.

Si sumamos los r estadsticos, 201 . . . 20r , obtenidos de las r muestras independientes, tenemos:
k
r
r
(Oij eij )2
2
2
00 =
0j =
2rk1) .
e
ij
j=1
j=1 i=1
Sin embargo, nos queda un problema por resolver: no conocemos la distribucion P que sigue X.
Normalmente, solo se quiere contrastar si el comportamiento de X es homogeneo en todas las
poblaciones, pero no cual es ese comportamiento (que distribucion concreta sigue). Por tanto, tenemos
que estimar P (Ai ) (i = 1 . . . k), y lo hacemos a partir de las observaciones mediante:
r
j=1 Oij
P
(Ai ) =
(i = 1 . . . k)
n1 + + nr
Denotemos por n la suma de todos los tama
nos muestrales: n = n1 + + nr . Con la estimacion
adoptada para cada P (Ai ), las frecuencias esperadas seran:
r
j=1 Oij
eij = nj P (Ai ) = nj
n
Una formula mas simetrica, y quiza mas facil de recordar, para el calculo de las frecuencias eij ,
se obtiene observando que: la suma de todas las frecuencias observadas en una misma poblacion,
k
no muestral de esa poblacion, nj . As, podemos calcular eij con
i=1 Oij , debe coincidir con el tama
la expresion:
( ki=1 Oij )( rj=1 Oij )

j=1 Oij
eij = nj
=
n
n
En denitiva, el estadstico utilizado es:
200
k
r
(Oij eij )2
=
eij
j=1 i=1
que sigue, cuando H0 es cierta, aproximadamente (para n grande) una distribucion

2rk1)k1) = 2r1)k1) .
Observese que, aunque se han estimado las k probabilidades P (Ai ), i = 1 . . . k, no hace falta estimar
una de ellas, pues entre todas han de sumar 1. De aqu que el n
umero de grados de libertad de la 2
baje solo k 1 unidades.

112
As, rechazaremos la hipotesis nula H0 :X se distribuye homogeneamente en las r poblaciones,

al nivel de signicacion , si:
200 =
k
r
(Oij eij )2
> 2r1)k1); .
e
ij
j=1 i=1
F
ormula para el c
alculo del estadstico. Como en el caso anterior, se suele utilizar la siguiente
identidad para el calculo del estadstico:
200 =
r
r
k
k
2
(Oij eij )2 Oij

=
n.
eij
eij
j=1 i=1
j=1 i=1
Ejercicio 3 Demostrar la formula anterior.

Ejemplo 46 Se ha dividido una poblaci
on en dos grupos, solteros y casados, y se han seleccionado
muestras de 40 solteros y 50 casados. Se les ha pedido opinion sobre determinada ley, resultando los
datos de la tabla
A favor En contra Abstencion Totales
Solteros
15
10
15
40
Casados
21
20
9
50
Totales:
36
30
24
90
Contrastese al nivel 0.05 si los resultados son homogeneos para los dos grupos.
n: La hipotesis de homogeneidad es:
Solucio
H0 : la opinion sobre esa ley se distribuye homogeneamente entre solteros y casados.
Adoptamos la siguiente notacion:
O11 = 15;
n1 =
O12 = 10;
O13 = 15;
O21 = 21;
O22 = 20;
O23 = 9
O1j = O11 + O12 + O13 = 15 + 10 + 15 = 40 = n

umero de solteros encuestados
j=1
n2 =
O2j = O21 + O22 + O23 = 21 + 20 + 9 = 50 = n

umero de casados encuestados
j=1
n = n1 + n2 = 40 + 50 = 90 = total de encuestados
F = a favor,
C = en contra,
A = abstencion
2
Oi1
O11 + O21
15 + 21
36
P
(F ) = i=1
=
=
=
90
90
90
2 n
O
+
O
O
10
+
20
30
i2
12
22
P
(C) = i=1
=
=
=
n
90
90
90
2
O
+
O
O
15
+
9
24
i3
13
23
P
(A) = i=1
=
=
=
n
90
90
90
36 30
90 66
24
o tambien: P
(A) = 1 P
(F ) P
(C) = 1
=
=
90 90
90
90
3. CONTRASTES
113
As, se obtienen las siguientes frecuencias esperadas:

36
36
e11 = n1 P
(F ) = 40
(F ) = 50
= 16
e21 = n2 P
= 20
90
90
30
30
40
50
(C) = 40
(C) = 50
=
e22 = n2 P
=
e12 = n1 P
90
3
90
3
24
24
32
40
e13 = n1 P
(A) = 40
(A) = 50
=
e23 = n2 P
=
90
3
90
3
Podemos ahora calcular el valor del estadstico, y usaremos la formula
k
r
2
Oij
2
00 =
n
eij
j=1 i=1
donde k = 2 (hay 2 tipos de poblaciones), y r = 3 (tres opiniones). En denitiva:

200
2
3
2
Oij
j=1 i=1
eij
n=
3 2
O1j
j=1
2
O11
e1j
2
O2j
90
+
e2j
2
2
2
2
2
O21
O12
O22
O13
O23
+
+
+
+
90
e11
e21
e12
e22
e13
e23
225 3 100 3 225 441 3 400 3 81
=
+
+
+
+
+
90
16
40
32
20
50
40
= 94.78125 90 = 4.78125
Ahora bien, para una 2 con (31)(21) = 2 grados de libertad y = 0.05 resulta que 22;0.05 = 5.991.
Como el valor del estadstico, 4.78125, es menor que 5.991 = 22;0.05 , aceptamos (al nivel 0.05)
la hipotesis nula, es decir, que la opinion sobre la ley citada se distribuye homogeneamente entre
solteros y casados.
3.3.
Contraste de independencia
Supongamos ahora que se quiere estudiar si dos caractersticas, X e Y , de una poblacion estan o no
relacionadas. Para este estudio, se recogen datos muestrales de ambas caractersticas conjuntamente,
obteniendo una muestra de datos agrupados:
(X1 Y1 ) . . . (Xn Yn ) .
Lo que se pretende es ver si, a la vista de la muestra, tiene sentido admitir que X e Y son independientes. Contrastaremos, pues, las hipotesis:
H0 : = X e Y son independientes
H1 : = X e Y no son independientes.
Como en casos anteriores, se toma una particion (arbitraria) del espacio muestral, en este caso,
para la variable (X Y ). Para ello, partimos el espacio muestral de X (posibles valores de X) en
k clases, A1 . . . Ak ; y el de Y en r clases B1 . . . Br . Estas particiones nos dan una particion del
espacio muestral de (X Y ) en k r clases:
A1 B1 . . . A1 Br A2 B1 . . . A2 Br . . . . . . Ak B1 . . . Ak Br .

114
Sean, ahora:
Oij = frecuencia observada en la clase Ai Bj

eij = frecuencia esperada en la clase Ai Bj , si se supone independencia (H0 cierta)
= nP (Ai )P (Bj )
Las primeras se obtienen de la muestra, y para las segundas se usan las estimaciones:
r
k
Oij
j=1 Oij
P (Ai ) =
;
P (Bj ) = i=1
n
n
de manera que, las frecuencias esperadas si H0 fuera cierta, tomando estas estimaciones, seran:
k
r
r
k
Oij
Oij
Oij
O
ij
j=1
j=1
i=1
i=1
(Ai )P
(Bj ) = n
eij = nP
=
.
n
n
n
Se toma el estadstico:
k
r
(Oij eij )2
2
00 =
eij
j=1 i=1
que sigue, cuando H0 es cierta, aproximadamente (para n grande) una distribucion 2 con
rk 1 (k 1) (r 1) = (r 1)(k 1) grados de libertad.
Como se puede observar, el estadstico anterior coincide con el utilizado para el contraste de homogeneidad, aunque tiene un origen distinto. En este caso, se han estimado k 1 de las k probabilidades
P (Ai ), para i = 1 . . . k, y r 1 de las r probabilidades P (Bj ), para j = 1 . . . r.
Finalmente, se rechazara la hipotesis de independencia (H0 ), al nivel de signicacion si:
200 =
r
k
(Oij eij )2
> 2r1)k1); .
e
ij
j=1 i=1
Ejemplo 47 Para estudiar la dependencia entre el habito de fumar y la hipertension, se tomaron

los siguientes datos sobre 200 individuos
No fumadores Fumadores Totales
Hipertensos
23
74
97
No hipertensos
54
49
103
Totales:
77
123
200
Realcese el contraste adecuado al 5 de signicacion.
n: Se trata de un contraste de independencia sobre las caractersticas X =ser fumador,
Solucio
e Y =sufrir hipertension. Tomamos como hipotesis nula:
H0 : sufrir hipertension no depende de ser fumador.
Los datos aportados nos dicen que se han dividido los espacios muestrales en las siguientes clases:
A1 =N F = no fumador, A2 = F = fumador,
B1 = H = hipertenso, B2 = N H = no hipertenso,
La muestra, para (X Y ), es de n = 200 individuos.
para la caracterstica X;
para la caracterstica Y .
3. CONTRASTES
115
Para realizar el contraste utilizaremos el estadstico:

200 =
siendo:
2
2
(Oij eij )2
eij
j=1 i=1
O11 = 23 ;
O12 = 74 ; O21 = 54 ; O22 = 49

123
77
P
(F ) =
P
(N F ) =
200
200
103
97
P
(N H) =
P
(H) =
200
200
77 97
123 97
e11 = nP
(N F )P
(H) =
(F )P
(H) =
e21 = nP
200
200
77
103
123 103
e12 = nP
(N F )P
(N H) =
(F )P
(N H) =
e22 = nP
200
200
Utilizando la formula de la seccion precedente para el estadstico, se obtiene:
200 =
2
2
2
Oij
j=1 i=1
eij
n=
2
2
2
2
O11
O21
O12
O22
+
+
+
200
e11
e21
e12
e22
200 232 200 542 200 742 200 492

+
+
+
200
77 97
123 97
77 103
123 103
239.041 200 = 39.041
=
Para decidir, a nivel de signicacion 0.05, comparamos este valor con 2t; 0.05 para una 2 con
t = (21)(21) = 1 grado de libertad: 21; 0.05 = 3.841. Como el estadstico toma un valor superior, hemos
de rechazar H0 , y se concluye (al 0.05 de signicacion) que hay dependencia entre la hipertension y
el habito de fumar.
Problemas
Contrastes param
etricos
1. Se sabe que una vacuna es efectiva contra cierta enfermedad en el 25 % de los casos. Para decidir
si una nueva vacuna es mas efectiva, se administra a 10 personas y se adopta la siguiente regla
de decision:
si el n
umero de personas protegidas es mayor que 4 se admite la nueva
vacuna.
a) Que tipo de contraste se debe utilizar? Indquense las hipotesis apropiadas.

b) Describir las regiones de aceptacion y de rechazo.
c) Calc
ulense las probabilidades de error tipo I y tipo II para el caso en que la nueva vacuna
sea efectiva en un 50 % de los casos.
2. Dada una muestra aleatoria de tama
no 5 de una poblacion N ( ; 1), se decide que < 5
siempre que x c (para cierta constante c).

116
a) Especicar que contraste de hipotesis realizaramos.

b) Para un nivel de signicacion = 0.05:
b.1 Obtengase c.
b.2 Determnese la potencia del test para = 4.
b.3 Calcular P aceptar H0 | = 5.5 .
3. Una empresa fabrica cuerdas cuya resistencia media a la rotura es de 300 kg., con desviacion
tpica 24 kg. Una muestra de 64 cuerdas fabricadas mediante un nuevo proceso dio una resistencia media de 310 kg. La compa
na desea estudiar si, efectivamente, el nuevo proceso da
mejores resultados que el antiguo. Realizar dicho estudio, con niveles de signicacion 0.10, 0.05
y 0.01.
4. La longitud media de los ejes fabricados por una compa
na es 7.05 mm con desviacion tpica
0.15 mm. Una muestra de tama
no 36, seleccionada como control del proceso, dio una media de
6.95 mm. Cabe esperar, a partir de este dato, que hay alg
un fallo en el proceso de produccion?
(Tomese nivel de signicacion = 0.05.)
5. Se ha aplicado un test de memoria a un gran n
umero de estudiantes, encontrandose desviaciones
tpicas de 33.5 para los alumnos y de 38.2 para las alumnas. Aplicando el test a 38 alumnos
y 45 alumnas se obtuvieron puntuaciones medias de 165.4 y 176.6 respectivamente. Se puede
asegurar, al nivel de conanza = 0.05, que el resultado del test de memoria es independiente
del sexo?
6. Una muestra de 200 bombillas de la marca A dio una vida media de funcionamiento de 2280
horas con desviacion tpica de 80 horas. Otra muestra de 180 bombillas de la marca B dio
vida media 2320 horas con desviacion tpica 100 horas. Se puede armar, al nivel 0.01, que es
mayor la vida media para la marca B?
7. Un laboratorio de farmacia arma que un producto que elabora es efectivo para aliviar cierta
molestia en no menos del 90 % de los casos en 12 horas. Ese medicamento recetado a una
muestra aleatoria de 300 personas enfermas dio buen resultado, al cabo de 12 horas, en 240
casos. Se puede aceptar al nivel de signicacion 0.01 que la armacion del laboratorio es
correcta?
8. Se sabe que cierto medicamento es efectivo en el alivio de cierta dolencia en el 60 % de los
casos. Los resultados experimentales sobre un medicamento nuevo administrado a una muestra
de 144 personas que sufran esa dolencia, muestran 100 casos con alivio. Se puede concluir, al
nivel 0.05, que el nuevo medicamento es mas efectivo que el antiguo.
9. Un fabricante de cierto artculo produce dos marcas del mismo. En una muestra de 200 consumidores, 64 haban consumido la primera marca, y en otra muestra de 120, 22 haban consumido la
segunda. Se puede armar que existe preferencia signicativa por la primer marca? Nivel 0.01 .
10. Una fabrica dispone de una seccion dedicada a empaquetar los artculos producidos, trabajando
en turnos de ma
nana y tarde. La experiencia ha demostrado que la distribucion del tiempo de
empaquetado de un artculo es aproximadamente normal en los dos turnos. Una muestra de
20 tiempos de empaquetado del turno de ma
nana (M) dio cuasivarianza 5.2 minutos y otra de
3. CONTRASTES
117
16 tiempos del turno de tarde (T) dio cuasivarianza 6.4 minutos. Contrastese la hipotesis nula
2
2
M
T2 frente a la alternativa M
> T2 , al nivel 0.01 .
11. Un fabricante de pilas electricas arma que la vida de la pilas que fabrica esta distribuida de
forma normal con desviacion tpica 0.8 meses. Se selecciona una muestra de 16 pilas resultando
una desviacion tpica muestral de 0.85.
a) Se puede asegurar al nivel 0.05 que > 0.8?
b) Una muestra de 10 pilas de otro fabricante dio cuasivarianza 0.70. Se puede concluir al
nivel 0.02 que la varianza para las dos marcas es la misma?
12. Se considera buena la edicion de un libro si el n
umero medio de erratas por pagina no supera
el 0.1 (H0 ). Dadas las pruebas de imprenta, se eligen 10 paginas al azar, y se rechazan las
pruebas si se observan 2 o mas erratas. Se supone que el n
umero de erratas por pagina sigue
una Poisson.
Que nivel de signicacion tiene el contraste? Con que probabilidad aceptaremos un libro si
realmente tiene una media de 0.2 erratas por pagina?
13. En una piscifactora se desea contrastar la hipotesis (H0 ) de que el porcentaje de peces adultos
que miden menos de 20 cm. es, como maximo, del 10 %. Para ello, se va a tomar una muestra
de 6 peces, y rechazaremos H0 si encontramos mas de un pez con longitud inferior a 20 cm.
a) Cual es el nivel de signicacion de este contraste?
b) Calcular la potencia del contraste si en realidad hay un 20 % de peces que miden menos
de 20 cm.
14. La concentracion media de dioxido de carbono en el aire en una cierta zona no es habitualmente
mayor que 355 p.p.m.v. (partes por millon en volumen). Se sospecha que esta concentracion es
mayor en la capa de aire mas proxima a la supercie. Para contrastar esta hipotesis se analiza
el aire en 20 puntos elegidos aleatoriamente a una misma altura cerca del suelo. Resulto una
media muestral de 580 p.p.m.v y una cuasidesviacion tpica muestral de 180. Suponiendo
normalidad para las mediciones, proporcionan estos datos suciente evidencia estadstica, al
nivel 0.01, a favor de la hipotesis de que la concentracion es mayor cerca del suelo? Indicar
razonadamente si el pvalor es mayor o menor que 0.01 .
15. Se van a probar dos medicamentos, A y B, contra una enfermedad. Para esto, tratamos 100
ratones enfermos con A y otros 100 con B. El n
umero medio de horas que sobreviven con A es
x = 1 200, y el n
umero medio con B es y = 1 400. Suponiendo normalidad en ambos casos, se
pide:
a) Para
= 0.10, se puede aceptar igualdad de varianzas si sabemos que
y (yi y)2 = 950 000?
(xi
x)2 = 900 000
b) Es mas efectivo el medicamento B? Plantear el contraste adecuado para estudiar esto

con un nivel de conanza del 95 %.

118
16. Con objeto de estudiar si las pulsaciones en los hombres pueden considerarse menores que en las
mujeres, se tomaron muestras de 16 hombres y 16 mujeres, obteniendose los siguientes datos:
Hombres (X): 74 77 71 76 79 74 83 79 83 72 79 77 81 79 84 80
Mujeres (Y): 81 84 80 73 78 80 82 84 80 84 75 82 79 82 79 85
Que se puede decir al respecto?
17. Se tienen algunos indicios de que el consumo de tabaco tiende a provocar problemas de trombosis debidos a un aumento en la capacidad de coagulacion. Para estudiar esta hipotesis, Levine
(1973) extrajo muestras de sangre de 11 individuos antes y despues de que fumasen un cigarrillo y midio la capacidad de agregacion de las plaquetas, obteniendo los datos siguientes
(correspondientes al maximo porcentaje de plaquetas que se agregaron despues de haber sido
sometidas a un estmulo adecuado):
Antes:
25 25 27 44 30 67 53 53 52 60 28
Despues: 27 29 37 56 46 82 57 80 61 59 43
Hay suciente evidencia estadstica (al nivel de signicacion 0.01) a favor de la hipotesis de que
los fumadores presentan mayor tendencia a la formacion de coagulos? Indicar las condiciones
que se requieren para que el test utilizado sea valido.
Contrastes
18. Se sabe que en cierta provincia durante un a
no dado han nacido 7423 ni
nos y 7043 ni
nas.
Es aceptable la hipotesis de igualdad de probabilidad de nacimiento de ni
no y ni
na en esa
provincia? Utilcese el nivel de signicacion 0.05 .
19. Una muestra aleatoria de 3839 observaciones de una poblacion en la que se ha clasicado a los
individuos en cuatro tipos A, B, C y D ha dado las siguiente composicion:
Tipo A
1997
Tipo B
906
Tipo C
904
Tipo D
32
Contrastese si es aceptable, al nivel del 1 %, la hipotesis:

H0 : P (A) = 9/16 P (B) = P (C) = 3/16 P (D) = 1/16 .
20. Los datos siguientes corresponden al n
umero de libros entregados en prestamo por una biblioteca durante los distintos das de una cierta semana. Utilizando el nivel de signicacion 0.05,
contrastese la hipotesis de que el n
umero de libros prestados no depende del da de la semana.
Libros prestados
Lunes
105
Martes
89
Miercoles
102
Jueves
92
Viernes
132
21. Con objeto de contrastar la hipotesis de igual probabilidad de nacimiento de hijo que de hija,
se estudiaron 200 familias de cuatro hijos con los siguientes resultados:
n
umero de hijos varones
n
umero de familias
4
13
3
52
Contrastese la hipotesis al nivel de signicacion = 0.05.
2
90
1
39
0
6
3. CONTRASTES
119
ustese a los datos siguientes una distribucion normal y est

udiese la bondad del ajuste (al 5 %).
22. Aj
Clases
6070
7080
8090
90100
100110
Frecuencia
5
18
42
27
8
23. En Espa
na, los tantos por ciento de personas de los grupos sanguneos O, A, B y AB son,
respectivamente, 39, 44, 13 y 4. Se selecciona una muestra de 200 individuos de una poblacion
situada en una zona monta
nosa con malos accesos, resultando 71 personas del grupo O, 69 del
A, 41 del B y 19 del AB. Contrastese, al nivel 0.01, si estos resultados concuerdan con los dados
para Espa
na.
24. Se han aplicado a tres grupos de pacientes tratamientos distintos A, B y C, obteniendose los
resultados de la tabla para el n
umero de pacientes con recada.
A
B
C
Con recada (R)

100
60
40
Sin recada (NR)

200
140
60
Contrastese al nivel del 5 % si pueden considerarse homogeneos los resultados obtenidos para
los tres tratamientos.
25. Despues de lanzar un dado 500 veces, se ha obtenido la siguiente tabla de frecuencias:
xi
ni
1
76
2
83
3
90
4
78
5
99
6
74
Al nivel se signicacion 0.05, se puede armar que el dado es regular?

26. Se clasicaron 1000 individuos de una poblacion seg
un el sexo y seg
un fueran daltonicos o no.
La tabla de frecuencias obtenida fue:
Masculino Femenino
Daltonico
38
6
No daltonico
442
514
Seg
un un modelo genetico, las probabilidades deberan ser:
1
q 12 q 2
2
1
2
p 12 p2 + pq
siendo q = 1 p = la proporcion en la poblacion de genes que provocan el daltonismo.
A partir de la muestra, se ha estimado que q = 0.087. Concuerdan los datos con el modelo?
27. Una fabrica de automoviles quiere averiguar si la preferencia de modelo tiene relacion con
el sexo de los clientes. Se toman dos muestras aleatorias de 1000 hombres y 1000 mujeres,
observandose las siguientes preferencias:
Modelo
Sexo
A
B
C
Son homogeneas las preferencias entre hombres y
mujeres,
al nivel de signicacion 0.01?
Mujer
340 400 260
Hombre 350 270 380

Contrastes PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Contrastes PDF

Cargado por

Copyright:

Formatos disponibles

Captulo 6

(Es decir, la maxima probabilidad de cometer el error de tipo I).

Si este cociente es peque

donde c se obtiene de la condici

Ejercicio 1 Escribir la denicion correspondiente al caso de una poblacion continua.

Primeramente, observese como se divide el espacio parametrico al realizar estas hipotesis:

el valor max f (x1 . . . xn ) se alcanza en el estimador de maxima verosimilitud

As el cociente de maximas verosimilitudes sera:

para el cociente de verosimilitudes maximas, donde s2 es la cuasivarianza muestral.

El valor de c2 se obtiene imponiendo que el test tenga nivel de signicacion :

Ahora bien, en este caso sabemos que

Podemos decir, entonces, que este test para contrastar H0 : = 0 frente a H1 : = 0 , al

En denitiva, nuestro test de razon de verosimilitudes, con nivel de signicacion , rechaza la

2.- X B(1 p) (muestras grandes)

s2p y f calculados como en los intervalos de conanza)

R = x y > tn1 +n2 2; sp n11 +

R = x y < tn1 +n2 2;1 sp n11 +

R = {s21 /s22 < Fn1 1;n2 1;1 }

5.- Comparacion de proporciones (muestras grandes e independientes)

X B(1 p1 ), (X1 . . . Xn1 ) m.a.s. de X

Ejemplo 43 Una fabrica viene utilizando un proceso A en la elaboracion de un artculo a base de

siendo XA N (A ; ) y XB N (B ; ), con desconocida. En este caso la region de rechazo es:

Contrastes de la bondad del ajuste

> 2t; se rechaza el modelo.

pues es evidente que

Contrastaremos, pues, las siguientes hipotesis:

que seguira una distribucion 2

con 6 1 = 5 grados de libertad. La siguiente tabla nos ayuda a

Observese que ei = nP (X = xi ) = 120 16 = 20 para todos los resultados.

umero X de llamadas telefonicas recibidas por minuto en una centralita

Contraste de homogeneidad de poblaciones

Supongamos que estamos interesados en estudiar si cierta caracterstica X, se comporta de igual

aproximadamente para nj grande, como vimos en el contraste anterior.

( ki=1 Oij )( rj=1 Oij )

que sigue, cuando H0 es cierta, aproximadamente (para n grande) una distribucion

As, rechazaremos la hipotesis nula H0 :X se distribuye homogeneamente en las r poblaciones,

(Oij eij )2 Oij

Ejercicio 3 Demostrar la formula anterior.

O1j = O11 + O12 + O13 = 15 + 10 + 15 = 40 = n

O2j = O21 + O22 + O23 = 21 + 20 + 9 = 50 = n

As, se obtienen las siguientes frecuencias esperadas:

donde k = 2 (hay 2 tipos de poblaciones), y r = 3 (tres opiniones). En denitiva:

Oij = frecuencia observada en la clase Ai Bj

Ejemplo 47 Para estudiar la dependencia entre el habito de fumar y la hipertension, se tomaron

Para realizar el contraste utilizaremos el estadstico:

O12 = 74 ; O21 = 54 ; O22 = 49

200 232 200 542 200 742 200 492

a) Que tipo de contraste se debe utilizar? Indquense las hipotesis apropiadas.

a) Especicar que contraste de hipotesis realizaramos.

b.3 Calcular P aceptar H0 | = 5.5 .

b) Es mas efectivo el medicamento B? Plantear el contraste adecuado para estudiar esto

Contrastese si es aceptable, al nivel del 1 %, la hipotesis:

Contrastese la hipotesis al nivel de signicacion = 0.05.

ustese a los datos siguientes una distribucion normal y est

Con recada (R)

Sin recada (NR)

Al nivel se signicacion 0.05, se puede armar que el dado es regular?

También podría gustarte