Documentos de Académico
Documentos de Profesional
Documentos de Cultura
González
Elementos de pruebas de hipótesis
es dado por
sup L(θ; x)
Θ0
λ(x) = .
sup L(θ; x)
Θ
Un test de razón de verosimilitud (LRT) es cualquier test que tenga una región de
rechazo de la forma {x : λ(x) ≤ c}, en que c es cualquier número tal que 0 ≤ c ≤ 1.
1
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
Por otro lado sup L(θ; x) se tiene cuando θ = x̄, ver ejemplo 80. Luego el LRT es
Θ
dado por
n
2 exp
−n
−1 P
sup L(θ; x) (2π)
2 (xi − θ0 )2
Θ0 i=1
λ(x) = =
n
2 exp
sup L(θ; x) −n
−1 P
Θ (2π)
2 (xi − x̄)2
i=1
( n n
!)
−1 X X
= exp (xi − θ0 )2 − (xi − x̄)2
2
i=1 i=1
( n n
!)
−1 X X
= exp x2i − 2θ0 nx̄ + θ0 2 n − x2i + 2nx̄2 − nx̄2
2
i=1 i=1
−n 2
= exp θ0 − 2θ0 x̄ + x̄2
2
−n 2
λ(x) = exp (x̄ − θ0 )
2
2
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
= exp {n(θ − x̄)} I[θ,+∞) x(1) = exp {n(θ − x̄)} I θ ≤ x(1) < ∞
= exp {n(θ − x̄)} I(−∞,x(1) ] (θ) .
3
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
L(θ; x)
1 θ
θ = x(1) = 1
Figura 65: θ versus L(θ; x) cuando x(1) = 1, x̄ = 1.02 y n = 10. Ejemplo 170.
Notando que L(θ; x) toma su valor máximo cuando θ = x(1) , ver figura 65, se tiene
que
sup L(θ; x) = exp n(x(1) − x̄) .
Θ
4
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
L(θ|x) θ0 = 0.9 1 θ
θ = x(1) = 1
Figura 66: θ versus L(θ; x) cuando x(1) = 1, x̄ = 1.02 y n = 10. θ0 = 0.9. Ejemplo
170.
1
L(θ|x)
θ0 = 1.2
θ = x(1) = 1 1 θ
Figura 67: θ versus L(θ; x) cuando x(1) = 1, x̄ = 1.02 y n = 10. θ0 = 1.2. Ejemplo
170.
5
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
Evaluación de Tests
El desempeño de un test es medido por la frecuencia con que se hacen juzga-
mientos correctos cuando se usa el test, ver Bickel & Doksum (1977)[p.166]. Hay dos
tipos de error que se pueden comenter cuando se utiliza un test:
1. que se rechace la hipótesis H0 cuando en realidad se debería aceptar, o
2. que se acepte (no se rechace) la hipótesis H0 cuando en realidad se debería
rechazar.
Note que NO se pueden cometer los dos tipos de error simultáneamente. Al error
presentado en el item 1. se le llama error tipo I y al error presentado en el item 2.
se le llama error tipo II . Ver tabla 23.
XXX
Tabla 23: Tipos de error.
XXX Verdad
Decisión XXXXX H0 es verdadera H1 es verdadera
Aceptar H0 No hay error Error tipo II
Rechazar H0 Error tipo I No hay error
6
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
Nota 68. Una función de potencia ideal sería que tome el valor 0 para todo θ ∈ Θ0
y tome el valor de 1 para todo θ ∈ Θc0 .
Ejemplo 171. Casella & Berger (2002)[p.383]. Sea X una variable aleatoria tal que
X ∼ Bin(5, θ). Sea el test H0 : θ ≤ 21 versus H1 : θ > 21 . Considere un test que
rechaza H0 si y solo si se obtienen solo éxitos, esto es, X = 5. Entonces la función
de potencia es dada por, ver figura 68,
5 5
β(θ) = Pθ (X ∈ R) = Pθ (X = 5) = θ (1 − θ)5−5 = θ 5 .
5
1.0
0.8
= (0.5)5 = 0.03125
0.6
β(θ)
0.4
1
2
0.2
0.0
H0 H1
0.0 0.2 0.4 0.6 0.8 1.0
θ 1
θ= 2
= 0.5
θ∈Θ0
Ejemplo 172. Retomando el ejemplo 171, luego el test quesup β(θ) = 0.03125,
θ∈Θ0
rechaza H0 si y solo se obtienen solo éxitos es un test de tamaño 0.03125.
Definición 67 Casella & Berger (2002)[p.385]. Para 0 ≤ α
. ≤ 1, un test con
función de potencia β(θ) es un test al nivel α si sup β(θ) ≤ α.
θ∈Θ0
c
A α se le llama nivel de significancia, Lehmann & Romano (2008)[p.57].
7
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
Potencia
1−β
β(θ)
0.4
0.2
α
0.0
H0 H1
0.0 0.2 0.4 0.6 0.8 1.0
θ
θ = 0.5
XXX
Tabla 24: Tipos de error y tamaño.
XXX Verdad
Decisión XXXXX H0 es verdadera H1 es verdadera
Aceptar H No hay error Error tipo II
0
1−α β
Rechazar H0 Error tipo I No hay error
α 1−β
Ejemplo 173. Continuando con el ejemplo 169, en que se tienen X1, . . . , Xn una
muestra aleatoria de una población N (θ, 1) y las hipótesis consideradas son
H : θ = θ0 versus H1 : θ 6= θ0 .
8
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
√ √
−2 ln(c) −2 ln(c)
√ √
X̄ − θ0 n X̄ − θ0 n
= Pθ 1 ≤− 1 + Pθ 1 ≥ 1
√ √ √ √
n n n n
! !
X̄ − θ0 p X̄ − θ0 p
= Pθ ≤− −2 ln(c) + Pθ ≥ −2 ln(c) .
√1 √1
n n
h p i
Bajo H0 verdadera, se tiene que β(θ) = 2P Z ≥ −2 ln(c) = 2 1 − Φ −2 ln(c) ,
p
Cabe notar que β(θ) toma su punto mínimo cuando θ = θ0 , ver figura 70. Así el test
es insesgado.
Nota 69. Casella & Berger (2002)[p.386]. Un LRT de tamaño α es construido al
escoger un c tal que
sup Pθ0 (λ(X) ≤ c) = α.
θ∈Θ0
Determinar c depende del problema particular.
9
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
1.0
1.0
0.8
0.8
Potencia
1−β
0.6
0.6
Potencia
1−β
β(θ)
β(θ)
fp2
0.4
0.4
c = 0.70
α = 0.3983
0.2
0.2
α = 0.0319
c = 0.10
0.0
0.0
−1 0 1 2 3 4 −1 0 1 2 3 4
θ0 = 2 θ θ0 = 2
10
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
2
−2 ln(c) = z1− α2
2
−z1− α
2
ln(c) =
2( )
2
−z1− α
2
c = exp ,
2
entonces
( r )
−2 ln(c)
{x : λ(x) ≤ c} = x : |x̄ − θ0 | ≥
n
v 2
u −z1− α
u
u
t −2 ln exp 2
2
{x : λ(x) ≤ c} = x : |x̄ − θ0 | ≥
n
v 2
u −z1− α
u
u − 2 2
t 2
{x : λ(x) ≤ c} = x : |x̄ − θ0 | ≥
n
s
2
z1−
α
2
z1− α2
{x : λ(x) ≤ c} = x : |x̄ − θ0 | ≥ = x : |x̄ − θ0 | ≥ √
n n
z1− α z1− α
{x : λ(x) ≤ c} = x : x̄ − θ0 ≥ √ 2 o x̄ − θ0 ≤ − √ 2
n n
z1− α2 z1− α2
{x : λ(x) ≤ c} = x : x̄ ≥ θ0 + √ o x̄ ≤ θ0 − √ .
n n
Ejemplo 175. Retomando el ejemplo 170, en que se tienen X1 , X2 , X3 , . . . , Xn va-
riables aleatorias independientes e idénticamente distribuidas
fX1 (x1 ; θ) = e−(x1 −θ) I[θ,+∞)(x1 ).
11
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
θ0 − ln(c)
n
Z
ln(c)
sup Pθ X(1) < θ0 − = sup n exp{−n(t − θ)}dt = 1 − α
θ≤θ0 n |{z} θ≤θ 0
d θ
Entonces
θ0 − ln(c)
n
θ0 − ln(c) !
Z n
sup n exp{−n(t − θ)}dt = − sup exp{−n(t − θ)} =1−α
θ≤θ0 θ≤θ0
θ θ
ln(c)
sup exp −n θ0 − −θ − 1 = −1 + α
θ≤θ0 n
sup [exp{ln(c) − n(θ0 − θ)}] = α
θ≤θ0
12
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
13
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
2. (Condición necesaria para ser un test más potente). Si existe ϕk (x), un test
(una función de test) de razón de verosimilitud de tamaño α, entonces cada
test UMP de nivel α es un test de tamaño α excepto en un conjunto A tal que:
Pθ0 (X ∈ A) = Pθ1 (X ∈ A) = 0.
Sea ϕ′k (x) una función de test para cualquier otro test de nivel α y sean β(θ)
y β ′ (θ) las funciones de potencia asociadas a ϕk (x) y ϕ′k (x), respectivamente.
i
luego
[ϕ(x) − ϕ′ (x)] [p(x; θ1 ) − kp(x; θ0 )] =
−1 × |[p(x; θ1 ) −
kp(x; θ0 )] Si ϕ(x) = 0 y ϕ′ (x) = 1
{z }
<0
0 × [p(x; θ ) − kp(x; θ )]
1 0 Si ϕ(x) = 1 y ϕ′ (x) = 1
1 × [p(x; θ1 ) − kp(x; θ0 )] Si ϕ(x) = 1 y ϕ′ (x) = 0
| {z }
>0
0 × [p(x; θ ) − kp(x; θ )]
1 0 Si ϕ(x) = 0 y ϕ′ (x) = 0
≥0
h
Definición de función de potencia, definición 65.
i
Como β ′ (θ) es de nivel α, se tiene que sup β ′ (θ) ≤ α, esto es, β ′ (θ0 ) ≤ α.
θ∈Θ0
14
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
Z Z Z Z
··· ϕ(x)p(x; θ1 )dx − · · · kϕ(x)p(x; θ0 )dx
| {z } | {z }
β(θ1 ) kβ(θ0 )
Z Z Z Z
− ··· ϕ′ (x)p(x; θ1 )dx + · · · kϕ′ (x)p(x; θ0 )dx ≥ 0
| {z } | {z }
β ′ (θ1 ) kβ ′ (θ0 )
h i
β(θ1 ) − β ′ (θ1 ) − k β(θ0 ) − β ′ (θ0 ) ≥ 0
| {z } | {z }
α ≤α
| {z }
≥0
entonces
h i
0 ≤ β(θ1 ) − β ′ (θ1 ) − k β(θ0 ) − β ′ (θ0 ) ≤ β(θ1 ) − β ′ (θ1 ) (89)
β ′ (θ1 ) ≤ β(θ1 )
por tanto, ϕ(x) es más potente que ϕ′ (x). Como α era arbitrario, ϕ(x) es un
test uniformemente más potente.
2. Sea ϕ′k (x) una función de test para cualquier test de nivel α uniformemente
más potente, entonces
β ′ (θ1 ) = β(θ1 )
y de (89) se tiene que
h i
′ ′
0 ≤ β(θ1 ) − β (θ1 ) −k β(θ0 ) −β (θ0 )
| {z } | {z }
0 α
h i
′
0 ≤ −k α − β (θ0 )
h i
k α − β ′ (θ0 )
0 ≥ |{z} =⇒ 0 ≥ α − β ′ (θ0 )
| {z }
>0 ≤α
′
0 ≥ α − β (θ0 ) ≥ 0
′
β (θ0 ) = α
por tanto ϕ′k (x) es un test de tamaño α. Retomando (88)
Z Z
··· ϕ(x) − ϕ′ (x) [p(x; θ1 ) − kp(x; θ0 )] dx
h i
= β(θ1 ) − β ′ (θ1 ) −k β(θ0 ) − β ′ (θ0 ) = 0
| {z } | {z }
0
0
15
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
Nota 72. Cox & Hinkley (1974)[p.92] En otras palabras, el Lema de Neyman-
Pearson dice que para cualquier tamaño α, la región crítica generada a partir de
la razón de verosimilitud es la mejor región crítica.
Ejercicio 75. Casella & Berger (2002)[p.405]. Sea X una variable aleatoria cuya
función de masa de probabilidad bajo H0 y Ha es dada por
x 1 2 3 4 5 6 7
f (x|H0 ) 0.01 0.01 0.01 0.01 0.01 0.01 0.94
f (x|Ha ) 0.06 0.05 0.04 0.03 0.02 0.01 0.79
1. Use Neyman-Pearson para encontrar el test más potente para probar H0 versus
Ha con tamaño α = 0.04.
y
t ∈ S c si g(t; θ1 ) < kg(t; θ0 ),
para algún k ≥ 0 en que α = Pθ0 (T ∈ S).
16
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
2σ 2
2x̄ (θ1 − θ0 ) > ln k + θ12 − θ02
| {z } n
<0
2σ2
n ln k + θ12 − θ02
x̄ <
2(θ1 − θ0 )
por tanto
2σ2
n ln k + θ12 − θ02
x̄ ∈ S si x̄ <
2(θ1 − θ0 )
y
2σ2
c n ln k + θ12 − θ02
x̄ ∈ S si x̄ > ,
2(θ1 − θ0 )
con
!
2σ2
n ln k + θ12 − θ02
α = Pθ0 (X̄ ∈ S) = Pθ0 X̄ < = Pθ0 X̄ < d
2(θ1 − θ0 )
| {z }
d
! !
X̄ − θ0 d − θ0 d − θ0
= Pθ0
√σ
<
√σ
=P Z<
√σ
, entonces
n n n
| {z }
Z
d − θ0
zα =
√σ
n
σzα
d = √ + θ0 .
n
17
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
Por tanto
ln(k) + n ln 1−θ1−θ1
0
x̄ ∈ S si x̄ <
θ1 (1−θ0 )
n ln θ0 (1−θ1 )
18
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
y
1−θ0
ln(k) + n ln 1−θ 1
x̄ ∈ S c si x̄ > ,
θ1 (1−θ0 )
n ln θ0 (1−θ1 )
con
!
1−θ0
ln(k) + n ln 1−θ1
α = Pθ0 (X̄ ∈ S) = Pθ0 X̄ < = Pθ0 X̄ < d .
n ln θθ10 (1−θ 0)
(1−θ1 )
| {z }
d
X̄ − θ0
q > z1−α .
θ0 (1−θ0 )
n
19
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
Ejemplo 178. Para ilustrar el caso en que no existe UN test uniformemente más
potente si no se restringe a los test insesgados es el siguiente, sea X una variable
aleatoria con distribución binomial de parámetros n y θ con 0 < θ < 1. Se quiere
probar las hipótesis
H0 : θ = θ0 versus Ha : θ 6= θ0
a un nivel α. Sean las hipótesis
H0′ : θ = θ0 versus Ha′ : θ = θ1
por tanto si θ0 > θ1 el test más potente rechaza para valores pequeños de x, pero si
θ0 < θ1 el test más potente rechaza para valores grandes de x, luego el test depende
de θ1 y no existe un test uniformemente más potente.
Nota 74. En general no es posible encontrar un test uniformemente más potente
de tamaño α, por ejemplo para el problema H0 : θ = θ0 versus H1 : θ 6= θ0 . Para
20
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
encontrar un test con optimas propiedades se restringe a una clase más pequeña de
test que son los test insesgados, ver definición 69, Roussas (1997)[p.349]. Una clase
de distribuciones en las cuales sí existe un test UMP de tamaño α es la familia de
distribuciones que tiene la propiedad de la razón de verosimilitud monótona (RVM).
Definición 72. Casella & Berger (2002)[p.391] La familia de funciones de densi-
dad de probabilidad o de funciones de masa de probabilidad {p(x; θ) : θ ∈ Θ} para una
variable aleatoria univariada X con parámetro de valor real θ se dice que tiene una
razón de verosimilitud monótona (RVM) si para cada θ2 > θ1, la razón p(x;θ 2)
p(x;θ1 )
es función monotona (no creciente o no decreciente) de x sobre {x : p(x; θ1 ) > 0 ó
p(x; θ2 ) > 0}. Note que 0c se define como ∞ si 0 < c.
luego
( n
)
p(x; µ2 ) 1X
= exp − [(xi − µ2 )2 − (xi − µ1 )2 ]
p(x; µ1 ) 2
i=1
( n
)
1 X
i − 2µ2 xi + µ2 − xi + 2µ1 xi − µ1 )
2 2 2 2
= exp − (x
2
i=1
( n n
!)
1 X
2
X
2
= exp − −2µ2 xi + nµ2 + 2µ1 xi − nµ1
2
i=1 i=1
n
1 X
= exp − n µ22 − µ21 exp (µ2 − µ1 ) xi
2 | {z }
| {z } i=1
K1 >0
K0 ≥0
( n
) n
P
X xi
K1
= K0 exp K1 xi = K0 e i=1
i=1
n
n
P
xi
La función es creciente en xi . Así es RVM creciente para
P
eK1 i=1 N (µ, 1)
i=1
n
xi .
P
T (x) =
i=1
21
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
luego
n
n
Yn
p(x; θ2 ) θ2 X
= exp − (θ2 − θ1 ) xi I(0,+∞) (xi )
p(x; θ1 ) θ1
| {z }
| {z } i=1 i=1
K1 >0
K0 >0
n
P n
xi Y
−K1
= K0 e i=1 I(0,+∞) (xi )
i=1
n
n
P
xi
La función es decreciente (estrictamente) en xi , por tanto p(x; θ) es
P
e−K1 i=1
i=1
n
RVM en xi .
P
i=1
22
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
! −n ! −n
θ̂02 2
−n n θ̂02 2
λ(x) = exp + = .
θ̂ 2 2 2 θ̂ 2
23
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
P n
1 2
(x − µ )
n i=1
i 0
−2
{x : λ(x) ≤ c} = x : ln
n
≥ ln(c)
1 P
n
n (xi − x̄)2
i=1
P n
(x − x̄ + x̄ − µ0 ) 2
i=1 i
−2
= x : ln n
≥ ln(c)
P n
(xi − x̄)2
i=1
P
n n
(xi
P
(xi − x̄)2 + 2 − x̄)(x̄ − µ0 ) + n(x̄ − µ0 )2
i=1
i=1 −2
= x : ln n
≥ ln(c)
P n
(xi − x̄)2
i=1
(x̄ − µ )2 −2
0
= x : ln 1 +
n ≥ n ln(c)
1 P 2
n (x i − x̄)
i=1
(x̄ − µ0 )2 −2
= x : ln 1 + ≥ ln(c)
θ̂ 2 n
(x̄ − µ0 )2 −2
= x:1+ ≥ exp ln(c)
θ̂ 2 n
(x̄ − µ0 )2 −2
{x : λ(x)} = x : ≥ exp ln(c) − 1
θ̂ 2 n
24
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
!
(X̄ − µ0 ) (X̄ − µ 0 )
α = Pθ0
≥ d = Pθ0 s
≥ d
θ̂ 1 P n
n 2
(Xi − X̄)
i=1
√ √
n(X̄ − µ0 ) n(X̄ − µ0 ) √
α = Pθ0 v
n ≥ d = Pθ0
≥ n − 1d
u 1 X Sn
u
u[n − 1] 2
(Xi − X̄)
u n−1
t i=1
| {z }
S2
n
25
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
1. ¿Existe alguna razón para creer, a un nivel de significancia del 0.05, que µA >
265?. Suponga que la varianza es conocida σA 2 = 180. Calcule el P -valor.
x̄ − µ0 274.7 − 265
b) zc =
√σ
= 13.4164
√
= 2.2863
n 10
c) El criterio de rechazo según la hipótesis alterna es: se rechaza H0 cuando
zc ≥ z1−α
26
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
0.4
0.3
φ (z)
0.2
P −valor=0.0143
0.1
0.0
−4 −2 0 2 4
z zc = 2.2863
0.4
0.3
φ (z)
0.2
α=0.05
0.1
0.0
−4 −2 0 2 4
x̄ − µ0 535.5 − 500
b) tc =
√s
= 69.0093
√
= 1.4550
n 8
c) El criterio de rechazo según la hipótesis alterna es: se rechaza H0 cuando
tc ≤ t α ,n−1
2
ó tc ≥ t1− α ,n−1
2
27
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
0.4
0.3
0.2
fT(t)
P −valor
2
= 0.0945
0.1
0.0
−4 −2 0 2 4
tc = 1.4550
t
0.4
0.3
0.2
fT(t)
α =0.05 α =0.05
2 2
0.1
0.0
−4 −2 0 2 4
t α = t0.05,7 = −1.8946 t1− α = t0.95,7 = 1.8946
2 2
t
y como c(θ) = −1
θ es creciente en θ , entonces el test que rechaza H0 : θ ≤ θ0 si y
2
2 2
n
solo si T (x) = Xi2 > t0 es un test uniformemente más potente de nivel α, en que
P
i=1
28
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
t0
χ2n,1−α =
θ02
θ02 χ2n,1−α = t0
esto es,
(n − 1)S 2
> χ2n−1,1−α .
θ02
Ejemplo 184. Retomando el ejemplo 183, ¿existe alguna razón para creer, a un
nivel de significancia del 0.05, que la varianza del peso en gramos luego de 64 días
de aplicada la dieta B sea mayor de 2000?
1. Las hipótesis nula y alterna son
2
H 0 : σB ≤ 2000 versus 2
H 1 : σB > 2000
3. El criterio de rechazo según la hipótesis alterna es: se rechaza H0 cuando χ2c >
χ2n−1,1−α con χ2n−1,1−α = χ27,0.95 = 14.07. Como 16.6680 > 14.07, se toma
la decisión de rechazar la hipótesis nula porque los datos arrojaron suficiente
29
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
P −valor=0.0197
0.04
0.00
0 5 10 15 20
χ2
c = 16.668
x
0.12
0.08
fX(x)
α=0.05
0.04
0.00
0 5 10 15 20
x χ2 2
n−1,1−α = χ7,0.95 = 14.067
30
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
2
σX σY2
X̄n ∼ N µX ,
n
y
Ȳm ∼ N µY ,
m
2
σX σY2
X̄n − Ȳm ∼ N µX − µY , +
n m
usando los resultados del ejemplo 181 el test que rechaza H0 : µX − µY ≤ θ0 si
X̄ − Ȳ > z1−α σX̄−Ȳ + θ0
r
2
σX σ2
> z1−α + Y + θ0
n m
esto es,
X̄ − Ȳ − θ0
q 2 2
> z1−α
σX σY
n + m
n + m
X
31
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
2
σX σ2
X̄n ∼ N µX ,
n
y Ȳm ∼ N µY , Y
m
2
σ σ2
X̄n ∼ N µX ,
n
y Ȳm ∼ N µY , m
σ2 σ2
X̄n − Ȳm ∼ N µX − µY , +
n m
X̄n − Ȳm − (µX − µY )
q ∼ N (0, 1)
1 1
σ n+m
2 2
con Sp2 = (n−1)S n+m−2
X,n+(m−1)S
el estimador de la varianza σ2.
Y,m
con 2
2
SX SY2
n + m
v≈ 2 2 2 .
S2
S
X Y
n m
n−1 + m−1
El test que rechaza H0 : µX − µY ≤ θ0 si
X̄ − Ȳ > tv,1−α σ̂X̄−Ȳ + θ0
r
2
SX S2
> tv,1−α + Y + θ0
n m
esto es,
X̄ − Ȳ − θ0
q
2
> tv,1−α
SX SY2
n + m
33
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
n + m
X
luego
E (X1 ) = µX y E (Y1 ) = µY
V ar (X1 ) = 2
σX y V ar (Y1 ) = σY2 y Cov (X1 , Y1 ) = ρσX σY
E (Y1 − X1 ) = µY − µX y V ar (Y1 − X1 ) = 2
σX + σY2 − 2ρσX σY .
n n
Si Di = Yi − Xi , D̄ = n1 y SD,n , se sabe que
P 2 1 P 2
Di = n−1 Di − D̄
i=1 i=1
√
n D̄n − (µX − µY )
∼ tn−1 .
SD,n
34
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
35
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
4. tc = D̄−θ0
SD,n
√
= −0.1−0
0.1414
√
= −1.5814
n 5
6. Buscando en la tabla
tn−1,1− α2 = t4,1− 0.05 = 2.776
2
36
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
n
P m
P
Xi + Yj
es test insesgado uniformemente más potente de nivel α, en que p̂ = m+n . i=1 j=1
37
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
1. Se sabe
56
p̂A = = 0.28 y nA = 200,
200
29
p̂B = = 0.1933 y nB = 150,
150
Pn Pm
Xi + Yj
i=1 j=1 56 + 29 85
p̂ = = = = 0.2429
m+n 200 + 150 350
3.
p̂X − p̂Y 0.28 − 0.1933
zc = q =q = 1.8718
1 1 1 1
p̂ (1 − p̂) n + m 0.2429 (1 − 0.2429) 200 + 150
38
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
√
Note que en este caso zc = | {zχ}2c = 3.5013 = 1.871176.
p
39
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
Y1i
vectores aleatorios bidimensionales, esto es, Y i =
Y 1, Y 2, . . . , Y n , indepen- Y2i
dientes e idénticamente distribuidos tal que Y 1 ∼ N2 (µ, Σ). La correspondiente
función de densidad conjunta es dada por
n n !
Y Y 1 −1
f (y 1 , y 2 , . . . , y n ) = f (y) = 1 exp [y i − µ]t Σ−1 [y i − µ]
2
i=1 2π|Σ|
2
i=1
( n
)
1 −1 X t −1
= exp
1 n
(y i − µ) Σ (y i − µ)
2π|Σ| 2 2
i=1
n
P
∂ y ti Σ−1 y i − y ti Σ−1 µ − µt Σ−1 y i + µt Σ−1 µ
∂ ln(f (y1 , y2 )) 1 i=1
=− ×
∂µ 2 ∂µ
( n n
) n
1 X X X
= − −2 Σ−1 y i + 2 Σ−1 µ = Σ−1 y i − nΣ−1 µ
|{z} 2
Nota 32. i=1 i=1 i=1
igualando a cero
n
X
Σ−1 y i − nΣ−1 µ̂ = 0
i=1
n
X
nΣ−1 µ̂ = Σ−1 y i
i=1
n
1X
µ̂ = yi.
n
i=1
40
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
n n
Por tanto µ̂Y = n1 y1i y µ̂Y = n1 y2i .
P P
1 2
i=1 i=1
Por otro lado, para encontrar el estimador de Σ, dado µ̂ fijo, se reescribe la
log-verosimilitud de la función de densida conjunta
n
n 1 X
ln(f (y)) = −n ln (2π) − ln (|Σ|) − (y i − µ̂)t Σ−1 (y i − µ̂)
2 2
i=1
n
n 1X
= −n ln (2π) − ln (|Σ|) − T raza (y i − µ̂)t Σ−1 (y i − µ̂)
2 2
i=1
n
n 1
(92)
X
= −n ln (2π) − ln (|Σ|) − T raza (y i − µ̂) (y i − µ̂)t Σ−1
|{z} 2 2
k i=1
igualando a cero
( " n # )
1 −1 −1 X −1
− nΣ̂ − Σ̂ (y i − µ̂) (y i − µ̂)t Σ̂ =0
2
i=1
k
Harville (1997)[p.51]. Para cualquier matriz A de orden m × n, cualquier matriz B de orden
n×p y cualquier matriz C de orden p × m,
T raza(ABC) = T raza(CAB) = T raza(BCA).
l
Magnus & Neudecker (1995)[p.178],
∂T raza(AB −1 ) t
= − B −1 AB −1 .
B
Harville (1997)[p.305],
∂ ln(|B|) t
= B −1 .
B
41
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
" n
#
−1 −1 X −1
nΣ̂ − Σ̂ (y i − µ̂) (y i − µ̂)t Σ̂ =0
i=1
" n #
−1 X t −1 −1
Σ̂ (y i − µ̂) (y i − µ̂) Σ̂ = nΣ̂
i=1
" n
#
−1 X t −1 −1
Σ̂Σ̂ (y i − µ̂) (y i − µ̂) Σ̂ Σ̂ = nΣ̂Σ̂ Σ̂
i=1
" n #
1 X
(y i − µ̂) (y i − µ̂)t = Σ̂
n
i=1
" n #
1 X y1i − µ̂Y1
y1i − µ̂Y1 y2i − µ̂Y2 = Σ̂
n y2i − µ̂Y2
i=1
" n #
1 X (y1i − µ̂Y1 )2 (y1i − µ̂Y1 ) (y2i − µ̂Y2 )
= Σ̂.
n (y1i − µ̂Y1 ) (y2i − µ̂Y2 ) (y2i − µ̂Y2 )2
i=1
Por tanto
n
1X
σ̂Y2 1 = (y1i − µ̂Y1 )2
n
i=1
n
1X
σ̂Y2 2 = (y2i − µ̂Y2 )2
n
i=1
n
1X
ρ̂σ̂Y1 σ̂Y2 = (y1i − µ̂Y1 ) (y2i − µ̂Y2 )
n
i=1
n
1 X
ρ̂ = (y1i − µ̂Y1 ) (y2i − µ̂Y2 ) .
nσ̂Y1 σ̂Y2
i=1
42
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
en que
σ̂Y2 1 0
Σ̂0 =
0 σ̂Y2 2
n
y sup L(θ; x) se tiene cuando ρ = nσ̂ 1σ̂ (y1i − µ̂Y1 ) (y2i − µ̂Y2 ). Entonces el LRT
P
Y1 Y2
θ∈Θ i=1
es dado por
sup L(θ; x)
θ∈Θ0
λ(x) =
sup L(θ; x)
θ∈Θ
n h i
1 −1 P t −1
1 n exp 2 (y i − µ̂) Σ̂0 (y i − µ̂)
2π|Σ̂0 | 2 i=1
= n h i
1 −1 P t −1
1 n exp 2 (y i − µ̂) Σ̂ (y i − µ̂)
2π|Σ̂| 2 i=1
!n ( n
)
Σ̂| 2
1
2π| 1 Xh t
h −1 −1
i i
= exp (y i − µ̂) Σ̂ − Σ̂ 0 (y i − µ̂)
Σ̂0 | 2
1
2π| 2
i=1
!n ( n )
|Σ̂| 2 1 Xh h −1 −1
i i
= exp (y i − µ̂)t Σ̂ − Σ̂0 (y i − µ̂)
|Σ̂0 | 2
i=1
en que
σ̂Y2 1 ρ̂σ̂Y1 σ̂Y2
|Σ̂| ρ̂σ̂Y σ̂Y σ̂Y2 2 σ̂ 2 σ̂ 2 − ρ̂2 σ̂ 2 σ̂ 2
= 1 2 2 = Y1 Y2 2 2 Y1 Y2 = 1 − ρ̂2
|Σ̂0 | σ̂Y
1
0 σ̂Y1 σ̂Y2
0 σ̂ 2
Y2
2
−1 2 −1
−1 −1 σ̂Y1 ρ̂σ̂Y1 σ̂Y2 σ̂Y1 0
Σ̂ − Σ̂0 = −
ρ̂σ̂Y1 σ̂Y2 σ̂Y2 2 0 σ̂Y2 2
43
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
1
−1 −1 1
σ̂Y2 2 −ρ̂σ̂Y1 σ̂Y2
2
σ̂Y
0
Σ̂ − Σ̂0 = − 1
1
σ̂Y2 1 σ̂Y2 2 2 2
− ρ̂ σ̂Y1 σ̂Y2 −ρ̂σ̂Y1 σ̂Y2
2 σ̂Y2 1 0 2
σ̂Y
2
2
σ̂Y 2 ρ̂σ̂Y1 σ̂Y2
2 − σ̂ −
2
1
= 2 2 1−ρ̂ρ̂σ̂ σ̂ Y2 σ̂2 1−ρ̂
2
luego
n h
X h −1 i i
−1
(y i − µ̂)t Σ̂ − Σ̂0 (y i − µ̂)
i=1
n
ρ̂ X ρ̂σ̂Y2 2 −σ̂Y1 σ̂Y2 y1i − µ̂Y1
= y 1i − µ̂ Y1 y 2i − µ̂ Y2
σ̂Y2 1 σ̂Y2 2 (1 − ρ̂2 ) i=1 −σ̂Y1 σ̂Y2 ρ̂σ̂Y2 1 y2i − µ̂Y2
| {z }
A
n
X ρ̂σ̂Y2 (y1i − µ̂Y1 ) − σ̂Y1 σ̂Y2 (y2i − µ̂Y2 )
=A y1i − µ̂Y1 y2i − µ̂Y2 2
ρ̂σ̂Y2 1 (y2i − µ̂Y2 ) − σ̂Y1 σ̂Y2 (y1i − µ̂Y1 )
i=1
n
(
X
=A ρ̂σ̂Y2 2 (y1i − µ̂Y1 )2 − σ̂Y1 σ̂Y2 (y2i − µ̂Y2 ) (y1i − µ̂Y1 ) + ρ̂σ̂Y2 1 (y2i − µ̂Y2 )2
i=1
)
− σ̂Y1 σ̂Y2 (y1i − µ̂Y1 ) (y2i − µ̂Y2 )
( n n
1X 1X
= A ρ̂σ̂Y2 2 n (y1i − µ̂Y1 )2 −2σ̂Y1 σ̂Y2 n (y2i − µ̂Y2 ) (y1i − µ̂Y1 )
n n
| i=1 {z } | i=1 {z }
2
σ̂Y ρ̂σ̂Y1 σ̂Y2
1
n
) ( )
1X
+ ρ̂σ̂Y2 1 n (y2i − µ̂Y2 )2 = A nρ̂σ̂Y2 2 σ̂Y2 1 − 2nρ̂σ̂Y2 1 σ̂Y2 2 + nρ̂σ̂Y2 1 σ̂Y2 2 =0
n
| i=1 {z }
2
σ̂Y
2
44
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
entonces
n n o
{x : λ(x) ≤ c} = x : ln 1 − ρ̂2 ≤ ln(c)
2
2
= x : ln 1 − ρ̂2 ≤ ln(c)
n
2 2
= x : 1 − ρ̂ ≤ exp ln(c)
n
2
= x : ρ̂2 ≥ 1 − exp ln(c)
n
corresponde a un test LRT para probar la hipótesis H0 : ρ = 0.
Ejercicio 81. Bickel & Doksum (2001)[p.290]. Sección 4.9, ejercicios 9 y 14.
Bondad de ajuste
En este tipo de pruebas se compara los datos de una muestra aleatoria clasificados
en un cierto tipo de categorias con las frecuencias esperadas para las categorías bajo
la hipótesis nula. Se rechazará la hipótesis nula si las frecuencias esperadas y las
frecuencias observadas difieren suficientemente, ver tabla 26.
2 π20 2 n
n
2
3 π30 3 n 3
.. .. .. ..
n
. . . .
ni
i πi0 i
.. .. .. ..
n
. . . .
nI
I πI0 I n
n n
Total Total
P P ni
πi0 = 1 n = 1
i=1 i=1
45
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
I
i = 1, 2, 3, . . . , I ,
y pi = 1. Entonces el vector aleatorio X1 X2 X3 . . . XI t
P
i=1
tiene una distribución multinomial con n ensayos y p1 , p2 , p3 , ..t . , pI probabilidades
de celda si la distribución conjunta de X1 X2 X3 . . . XI es
n!
f (x1 , x2 , x3 , . . . , xI ; p1 , p2 , p3 , . . . , pI ) = px1 px2 px3 . . . pxI I
x1 !x2 !x3 ! . . . xI ! 1 2 3
I
!
n! Y
pxi i
= I
Q
xi ! i=1
i=1
la función de log-verosimilitud es
I
!
n! Y
pxi i
l(p1 , p2 , p3 , . . . , pI−1 ; x1 , x2 , x3 , . . . , xI−1 ) = ln I
Q
xi ! i=1
i=1
I
X I
X
= ln (n!) + xi ln (pi ) − ln (xi !)
i=1 i=1
I−1 I−1
! I−1
! I
X X X X
= ln (n!) + xi ln (pi ) + n− xi ln 1 − pi − ln (xi !)
i=1 i=1 i=1 i=1
46
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
xI
z }| {
I−1
X
n− xi
xi i=1 xi xI
= + (−1) = −
pi I−1
X pi pI
1− pi
i=1
| {z }
pI
I I−1
X X xi p̂I
p̂i = 1 ⇔ + p̂I = 1 ⇔
XI
i=1 i=1
I−1
!
X XI
p̂I xi + XI = XI ⇔ p̂I =
n
|i=1 {z }
n
xi XnI
= p̂i i = 1, 2, 3, . . . , I − 1
XI
xi
= p̂i i = 1, 2, 3, . . . , I − 1
n
luego el estimador vía máxima verosimilitud para pi es p̂i = xn , i = 1, 2, 3, . . . , I .i
47
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
entonces
sup L(θ; x) sup L(p1 , p2 , p3 , . . . , pI−1 ; x1 , x2 , x3 , . . . , xI−1 )
Θ0 Θ0
λ(x) = =
sup L(θ; x) sup L(p1 , p2 , p3 , . . . , pI−1 ; x1 , x2 , x3 , . . . , xI−1 )
Θ Θ
I
Q
I
n!
pxi0i
i=1 I I I
Q
i=1
xi ! Y pxi0i Y nxi pxi0i Y npi0 xi
= = x = =
i=1 xni i xxi i xi
I i=1 i=1
n! Q xi xi
I n
i=1
Q
xi !
i=1
para cada θ ∈ Θ0 .
Retomando
" I #
Y npi0 xi
−2 ln [λ (x)] = −2 ln
xi
i=1
I
X npi0 D
= −2 xi ln −−−→ χ2I−1
xi
i=1
48
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
entonces
lı́m Pθ {x : λ{x} ≤ c} = α
n→∞
( I x )
Y npi0 i
lı́m Pθ x : ≤c =α
n→∞
i=1
xi
( " I # )
Y npi0 xi
lı́m Pθ x : −2 ln ≥ −2 ln(c) = α
n→∞
i=1
xi
( I )
X npi0
lı́m Pθ x : −2 xi ln ≥ −2 ln(c) = α
n→∞
i=1
xi
( I )
X npi0
lı́m Pθ x : −2 xi ln < −2 ln(c) = 1 − α
n→∞
i=1
xi
χ2I−1,1−α = −2 ln(c)
( )
−χ2I−1,1−α
exp =c
2
49
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
p4 0.10 p4 0.10
3.
I
X npi0
χ2c = −2 xi ln
xi
i=1
300 × 0.50 300 × 0.25
= −2 140 ln + 90 ln +
140 90
300 × 0.15 300 × 0.10
30 ln + 40 ln = 12.1865
30 40
5. Buscando en la tabla
χ2I−1,1−α = χ23,0.95 = 7.8147
50
Notas de Clase elaboradas por L. M. González
Elementos de pruebas de hipótesis
p4 0.10 p4 0.10
3.
I
X (xi − npi0 )2
χ2c =
npi0
i=1
(140 − 300 × 0.50)2 (90 − 300 × 0.25)2 (30 − 300 × 0.15)2
= + +
300 × 0.50 300 × 0.25 300 × 0.15
(40 − 300 × 0.10)2
+ = 12
300 × 0.10
51
Notas de Clase elaboradas por L. M. González
REFERENCIAS Elementos de pruebas de hipótesis
5. Buscando en la tabla
χ2I−1,1−α = χ23,0.95 = 7.8147
Referencias
Bickel, P. & Doksum, K. (1977), Mathematical Statistics: Basic ideas and selected
topics, San Francisco: Holden-Day Inc.
Bickel, P. & Doksum, K. (2001), Mathematical Statistics: Basic ideas and selected
topics, Vol. I, second edn, New Jersey: Prentice Hall.
Canavos, G. (1988), Probabilidad y estadística. Aplicaciones y Métodos, México: Mc
Graw-Hill.
Casella, G. & Berger, R. (2002), Statistical Inference, second edn, Thomspon Lear-
ning.
Cox, D. & Hinkley, D. (1974), Theoretical statistics, first edn, New York: Springer.
52
Notas de Clase elaboradas por L. M. González
REFERENCIAS Elementos de pruebas de hipótesis
53