Documentos de Académico
Documentos de Profesional
Documentos de Cultura
estadísticas
28 de marzo de 2023
Capítulo 2
Familias Exponenciales y
Aplicaciones Estadísticas
1 Introducción
1
2 Cirilo alvarez R.
Ahora escribiendo
n
X
2
η(σ ) = − 2σ1 2 , T (x1 , x2 , . . . , xn ) = x2i , B(σ 2 ) = n log σ 2 ,
i=1
y
n
h(x1 , x2 , . . . , xn ) = (2π)− 2 I(x1 ,x2 ,...,xn )∈IRn ,
4 Cirilo alvarez R.
2 )S(t)−B(σ 2 )
fT (t|σ 2 ) = eη(σ h(t).
Claramente, algo muy interesante está pasando. Empezamos con una den-
2 2
sidad básica en una forma específica, esto es, f (x|σ 2 ) = eη(σ )T (x)−B(σ ) h(x),
y luego encontramos que la densidad conjunta y la densidad de la estadís-
tica unidimensional relevante ni=1 Xi2 en esa densidad conjunta, son una
P
θx e−θ 1
Pθ (x) = P(x; θ) = = eln(θ)x−θ , x ∈ X = {0, 1, 2, . . .}, θ > 0
x! x!
1
η(θ) = ln θ, B(θ) = θ, T (x) = x, h(x) = .
x!
1 xα−1
η(λ) = − , T (x) = x, B(λ) = α ln λ, h(x) = Ix>0 .
λ Γ(α)
µ2 x2
µx− −log[Φ(b−µ)−Φ(a−µ)] √1 −
f (x|µ) = e 2
2π
e 2 Ia≤x≤b
ces, podemos encontrar funciones η(µ), T (x) tal que para todo x, µ,
1
eη(µ)T (x) = 2
=⇒ η(µ)T (x) = − ln 1 + (x − µ)
1 + (x − µ)2
=⇒ η(0)T (x) = − ln 1 + x2
=⇒ T (x) = −c ln 1 + x2
−cη(µ) ln 1 + x2 = − ln 1 + (x − µ)2
1 ln(1 + (x − µ)2 )
=⇒ η(µ) = .
c ln(1 + x2 )
ln(1 + (x − µ)2 )
Este significa que debe ser una función constante de x, que
ln(1 + x2 )
es una contradicción. La elección de µ = 0 como el valor especial de µ no
es importante. ■
1 − 1 (x−µ)2
fθ (x) = √ e 2σ02 , x∈R
σ0 2π
(m)
fθ = f (x; µ) = f (x1 , x2 , . . . , xm ; µ)
m
Y 1 − 1 (x−µ)2
= √ e 2σ02
σ 2π
i=1 0
m
Y 1 − 1 (x2 −2µx+µ2 )
= √ e 2σ02 i
σ 2π
i=1 0
1 Pm 2 2
m − i=1 (xi −2xi µ+µ )
(2πσ02 )− 2 e 2σ0
2
=
1 Pm µ Pm u2
m − x2i xi −m
(2πσ02 )− 2 e 2σ0
2 i=1 2
σ0 i=1 2σ02
= e
Pm 2
µ Pm u2 1 i=1 xi +m ln
σ2 i=1 xi −m 2σ02 −
2 2
σ0
(2πσ02 )
=e e
m
Y
P(x1 , x2 , . . . , xm ; θ) = P(xi ; θ)
i=1
m
Y n ln( 1−θ
θ
)xi +n ln(1−θ)
= e
i=1
x i
m
θ
ln( 1−θ )
Pn
i=1 xi +mn ln(1−θ)
Y n
=e
i=1
xi
16 Cirilo alvarez R.
Escribiendo
m
θ X
η(θ) = ln , T (x) = xi
1−θ i=1
m
Y n
B(θ) = −mn ln(1 − θ), h(x) =
i=1
xi
Escribiendo
m
X
η(α) = (α − 1) T (x) = ln xi
i=1
− m
P
B(α) = m ln Γ(α) h(x) = e i=1 xi
∗
eso, obtenemos una densidad g reparametrizada en la forma eηT (x)−B (η) h(x).
Por un ligero abuso de notación, de nuevo usaremos la notación f para g y
B para B∗ .
donde
Z
B(η)
η ∈ T = {η : e = eηT (x) h(x)dx < ∞}
Rm
en el caso continuo, y
X
T = {η : eB(η) = eηT (x) h(x) < ∞}
x∈X
θ θ eη 1
ln =η⇒ = eη ⇒ θ = η
y 1−θ = ,
1−θ 1−θ 1+e 1 + eη
Por lo tanto, la forma de familia exponencial canónica de la distribución
binomial es
ηx−n ln(1+eη ) n
f (x | η) = Pη (x) = e Ix∈{0,1,2,...,n} .
x
El espacio paramétrico natural es T = IR y B(η) = n ln(1 + eη ) ■
Cirilo alvarez R. 21
τ = {η : eB(η) = 1 + eη } = IR.
Luego
η
P(x|η) = eηx+ln(1+e ) Ix∈{0,1}
Por consiguiente la familia de distribuciones {Pη : η ∈ IR} está en la familia
exponencial canónica de un-parámetro. ■
22 Cirilo alvarez R.
Pero
Z Z
(αη1 +(1−α))T (x)
e h(x)dx = e(αη1 )T (x) × e(1−α)η2 T (x) h(x)dx
Rm Rm
Z
α (1−α)
= eη1 T (x) eη2 T (x) h(x)dx
Rm
dk B(η)
Z
e = [T (x)]k eηT (x) h(x)dx
dη k Rm
24 Cirilo alvarez R.
y en el caso discreto,
dk B(η) X
k
e = [T (x)]k eηT (x) h(x)dx
dη x∈X
existe, y el límite puede ser llevado acabo dentro de la integral para obtener
Esta fórmula compacta para una derivada arbitraria de eB(η) conduce a las
siguientes fórmulas importantes de momentos.
MT (s) = eB(s+η)−B(η) .
Ψ(T ) = eB(η+it)−B(η)
dk B(η)
Z
k
e = [T (x)]k eηT (x) h(x)dx.
dη IRm
que da el resultado
Eη [T (X)] = B′ (η)
26 Cirilo alvarez R.
d2 B(η)
Z
2
e = [T (x)]2 eηT (x) h(x)dx.
dη m
ZIR
′
B′ (η)eB(η) = [T (x)]2 eηT (x) h(x)dx.
m
ZIR
B′′ (η) + {B′ (η)}2 eB(η) = [T (x)]2 eηT (x) h(x)dx.
IRm
de donde se obtiene
Z
′′ ′
B (η) + {B (η)} = 2
[T (x)]2 eηT (x)−B(η) h(x)dx.
IRm
la cual da
E[T (X) − E (T (X))]3 = E[T (X)]3 − 3E[T (X)]2 E[T (X)] + 2 {E[T (X)]}3
(4.1)
usamos la identidad
d3 B(η)
Z
e = [T (x)]3 eηT (x) h(x)dx.
dη 3 IRm
Cirilo alvarez R. 27
MT (s) = eB(s+η)−B(η)
28 Cirilo alvarez R.
Propiedad
(k) (k) dk ΨT (s)
ΨT (0) = ik Eη (T (X)), donde ΨT (0) = ,
dsk s=0
la k-ésima derivada evaluada en el el punto 0.
2 2 d2 ΨT (s)
i Eη (T (X)) =
ds2 s=0
d dΨT (s)
=
ds ds s=0
d ′
B (is + η)eB(is+η)−B(η)
=i
ds s=0
h n oi
2 B(is+η)−B(η) ′′ ′ 2
=i e B (is + η) + (B (η))
s=0
n o
2
= i2 B′′ (η) + (B′ (η))
2
Eη (T 2 (X)) = B′′ (η) + (B′ (η))
Cirilo alvarez R. 31
Luego,
X
donde h∗ (t) = h(x).
x:T (x)=t
donde
η1 (θ) T1 (X)
η2 (θ) T2 (X)
θ = (θ1 , θ2 , . . . , θk ); η(θ) =
T (X) =
.
..
.
..
ηk (θ) Tk (X)
es igual a k.
Teorema 5.1. Los resultados del teoremas 4.1 y 4.6 se cumplen para la
familia de k -parámetros.
Las pruebas son casi literalmente las mismas. Las formulas de los momentos
difieren ligeramente debido a la presencia de más de un parámetro en el
contexto actual.
donde Z
Pk
k ηi Ti (x)
T = η∈R : e i=1 h(x)dx < ∞
Rm
(siendo la integral reemplazada por la sumatoria en el caso discreto.)
36 Cirilo alvarez R.
(b)
∂
Eη (Ti (X)) = B(η).
∂ηi
y
∂2
Covη (Ti (X), Tj (X)) = B(η), 1 ≤ i, j ≤ k.
∂ηi ∂ηj
MT (s) = eB(η+s)−B(η) .
ΨT (s) = eB(η+is)−B(η) .
donde
T1 (x)
⟨η(θ)|T (x)⟩ = (η1 (θ), η2 (θ)) = η1 (θ)T( x) + η2 (θ)T2 (x).
T2 (x)
Resulta que,
n2 − n n(n + 1) n(n + 3)
k =n+n+ =n+ =
2 2 2
1 ′ −1 (x−µ)
f (x|θ) = Ce− 2 (x−µ) Σ I(x ∈ Rn ).
1 ′ −1 x+µ′ Σ−1 x− 1 µ′ Σ−1 µ
= Ce− 2 x Σ 2 I(x ∈ Rn )
1
σ ij xi xj + i=1 ( k σ ki µk )xi − 12 µ′ Σ−1 µ
P P P P
= Ce− 2 i j I(x ∈ Rn ).
1 1 ′ −1
σ ij x2i − i<j σ xi xj + i ( k σ µk )xi − 2 µ Σ
ij
P PP P P ki
= Ce− 2 i µ
I(x ∈ Rn ),
1
donde la contante C es igual a C = [(2π)n |Σ|]− 2 .
Denotando
11 12 1n
σ σ ··· σ
21
σ σ 22 · · · σ 2n
Σ−1 =
... ..
.
..
.
..
.
σ n1 σ n1 · · · σ nn
k k
!n−Pki=1 xi
Y X n!
f (x|θ) = θixi 1− θi k
! k
!
i=1 i=1
Y X
xi ! n− xi !
i=1 i=1
Pk
xi (ln θi )−( ki=1 xi ) ln(1− ki=1 θi )+n ln(1− ki=1 θi )
P P P
=e i=1
n!
× k
! k
! × Ix1 ,x2 ,...,xk ≥0,Pk xi ≤n
Y X i=1
xi ! n− xi !
i=1 i=1
Pk θ
Pi +n ln(1− ki=1 θi ) n!
P
i=1 xi ln
1− k θ
=e i=1 i
k
! k
!
Y X
xi ! n− xi !
i=1 i=1
θi
T(X) = (X1 , X2 , . . . , Xk ), ηi (θi ) = ln k
!, 1≤i≤k
X
1− θi
i=1
y
n!
h(x) = k
! k
! Ix1 ,x2 ,...,xk ≥0,Pk xi ≤n .
Y X i=1
xi ! n− xi !
i=1 i=1
■
44 Cirilo alvarez R.
6 Suficiencia y Completitud
Entonces,
2
X n x
E[g(X)] = g(x) θ (1 − θ)2−x
x=0
x
1 3
= 16θ2 − 16θ + 3 = 0, si θ = o
4 4
Por lo tanto, hemos exhibido una función g que infringe la condición de
completitud de esta familia de distribuciones. ■
Ejemplo 6.4. Supongamos que X1 , X2 son iid U [0, θ], y θ pertenece a algún
subconjunto Θ de (0, ∞), Sea S(X1 , X2 ) = X X2
1
. Se desea probar que este
estadístico es ancillary. El estadístico S(X1 , X2 ) se puede escribir como
sigue:
L θU1
S(X1 , X2 ) =
θU2
donde U1 , U2 son variables aleatorias iid en U [0, 1]. Por lo tanto, según
cualquier distribución Pθ , S(X1 , X2 ) se distribuye como la relación de dos
variables U [0, 1] independientes. Esta es una distribución fija que no depen-
X1
de de θ. Por lo tanto,S(X1 , X2 ) = X 2
es un estadístico ancillary, sea cual
sea el conjunto de valores de θ. ■
n
X
de la línea real. Sea S(X1 , X2 , . . . , Xn ) = (Xi − X)2 ). Podemos escribir
i=1
S(X1 , X2 , . . . , Xn ) como
n n
L
X X
2
S(X1 , X2 , . . . , Xn ) = [(µ + Zi ) − (µ + Z)] = (Zi − Z)2 ,
i=1 i=1
Pn = {Pθ,n : θ ∈ Θ}.
(muestra) podría haber proporcionado. Por otro lado, una estadística an-
cillary no puede proporcionar ninguna información acerca de θ, ya que su
distribución no incluye θ. El teorema de Basu dice que una estadística que
proporciona toda la información, y otra que no proporciona información,
deben ser independiente, siempre que se mantenga la condición adicional
del interior no vacía, para asegurar la integridad de la familia Pn . Por lo
tanto, los conceptos de información , suficiencia, ancillaridad, completitud
e independencia se unen en el teorema de Basu. Sin embargo, nuestro prin-
cipal interés es simplemente usar el teorema de Basu como una herramienta
conveniente para llegar rápidamente a algunos resultados que son puramente
resultados en el dominio de la probabilidad. Damos a continuación algunos
ejemplos.
Ahora,
n
! n
!
η + τ Z,
X X
X, (Xi − X)2 = (Zi − Z)2
i=1 i=1
Pn
Por consiguiente, X y i=1 (Xi − X)2 son independientemente distribuidos
según η, τ si y solo si Z y ni= (Zi − Z)2 son independientemente distri-
P
obviamente tiene un interior no vacío, por lo tanto, todas las condiciones del
teorema de Basu están satisfechas, y por lo tanto, según cada µ, ni=1 Yi y
P
Pn 2
i=1 (Yi − Y ) se distribuyen independientemente. En particular, se distri-
buyen independientemente según µ = 0, es decir, cuando las muestras son
iid N (0, 1), que es lo que necesitamos probar.
Para esto, una vez más, escribiendo Xi = λZi , i ≤ i ≤ n donde las Zi son
52 Cirilo alvarez R.
X1 X n−1
Xn ,··· , n ,
X
Xi Xi
i=1 i=1
n
X1 X n−1 X
Xn , · · · , n
y Xi
X
i=1
Xi Xi
i=1 i=1
implica
Cov(X1 + · · · Xn , X − Mn ) = 0 =⇒ Cov(nX, X − Mn ) = 0
=⇒ nCov(X, X − Mn ) = 0
=⇒ Cov(X, X − Mn ) = 0
=⇒ Cov(X, X) − Cov(X, Mn ) = 0
luego,
1
Cov(X, Mn ) = Cov(X, X) = Var(X) =
n
Hemos logrado este resultado sin hacer ningún cálculo en absoluto. Un
desarrollo directo a este problema requiere el manejo de la distribución
conjunta de (X, Mn ). ■
1 1 2
f (x|θ) = √ e 2θ2 ((x−θ) I(x ∈ R)
2π|θ|
1 x x2 1
= √ e θ − 2θ2 − 2 −ln |θ| I(x ∈ R)
2π
n
X
T2 (x, z) = Xi , y
i=1
n
Y z xi i
h(x, z) = P(z1 , z2 , . . . , zn )I(x1 ,x2 ,...,xn ∈N0 ) I(z1 ,z2 ,...,zn ∈N1 )
i=1
xi !
Ejercicios
Ejercicio 1
Demuestre que la distribución geométrica pertenece a la familia exponencial
de un parámetro si 0 < θ < 1 y escriba en la forma canónica y utilizando la
parametrización de la media.
Ejercicio 14
Calcule el mgf de una distribución multinomial de (k + 1) celdas usando el
Teorema 5.2
[4] George Casella, Roger L. Berger. (2002), Statistical Inference, 2nd Edi-
tion, P. cm.
65
66 Cirilo alvarez R.
(2)13, 84
Disponible en www.cs.columbia.edu,
Disponible en people.eecs.berkeley.edu