Documentos de Académico
Documentos de Profesional
Documentos de Cultura
3.1. INTRODUCCIÓN
3.1 Introducción
Sea X la población objeto de estudio. Suponemos que X tiene función de distribución conocida (en cuanto
a su forma funcional), pero desconocemos un parámetro θ del que depende.
En el Tema anterior hemos calculado la distribución de algunos estadísticos y mencionado que los estadís-
ticos se utilizan para estimar los valores de parámetros desconocidos de una población.
Para comenzar a tratar con la estimación de parámetros, en este Tema estudiamos la reducción de datos
(sin pérdida de información relevante) para, en Temas posteriores, especificar las propiedades deseables de
los estimadores y desarrollar las técnicas apropiadas para implementar el proceso de estimación (estimación
puntual y estimación por intervalo).
En estadística clásica, el parámetro poblacional θ se considera una cantidad fija (nunca una v.a.) pero des-
conocida. La estimación del parámetro desconocido involucra:
y un estadístico T (X1 , . . . , Xn ).
Con el manejo de los estadísticos se pretende simplicar la estructura del problema a trabajar en un espacio
de menor dimensión. Pero, el uso de cualquier estadístico, T (X1 , . . . , Xn ) implica una reducción de datos y,
por tanto, se pierde información. Por ello, nos planteamos buscar estadísticos tales que la información que
se pierde sea irrelevante para el objetivo planteado.
E El valor x del estadístico muestral X, calculado a partir de una muestra de tamaño n es una
estimación puntual del parámetro poblacional μ.
X ∼ { fθ (x), θ ∈ Θ ⊆ Rk }
Dada la familia P = { fθ (x), θ ∈ Θ ⊆ Rk }, puesto que las n v.a. de la muestra constituyen una v.a.
n-dimensional, se llama función de verosimilitud de la muestra a la función de densidad conjunta
de la variable aleatoria n-dimensional.
L(θ|x) = f (x|θ)
E Son ejemplos de familias exponenciales las distribuciones binomial, binomial negativa, geométri-
ca, Poisson, exponencial, normal, gamma, beta.
Teorema 3.1
Sea X1 , . . . , Xn una m.a.s procedente de una población con distribución en la familia exponencial k-
paramétrica. Entonces, (X1 , . . . , Xn ) también pertenece a la familia exponencial.
X = μ + σZ μ, σ ∈ R, σ > 0
En particular, si Z es una v.a. absolutamente continua con función de densidad f (x), la familia de
funciones de densidad
1 x−μ
{ f (x|μ, σ) = f : μ ∈ R, σ > 0}
σ σ
forman la familia de localización y escala de f(x).
E Son ejemplos de familias de localización y escala las distribuciones normal, doble exponencial,
Cauchy.
Proposición 3.1
1. Z ∼ f (x) ⇔ X = σZ + μ ∼ f (x|μ, σ)
X −μ
2. X ∼ f (x|μ, σ) ⇔ ∼ f (x)
σ
P = {F(x1 , . . . , xn | θ)| θ ∈ Θ}
Pθ (x1 , . . . , xn | T ) es independiente de θ
N Observaciones:
1. El hecho de que un estadístico sea o no suficiente para un parámetro depende del modelo de
distribución que sigan las variables implicadas.
Xi ∼ Bernoulli(θ), xi = 0, 1 ∀ i = 1, . . . , n, ∀ θ ∈ (0, 1)
Parece intuitivo que, para determinar θ (probabilidad de éxito) no es necesario saber las posiciones
en que se han producido los éxitos. Bastará saber cuál es el número total de éxitos t = ∑ni=1 xi (el
número total de éxitos obtenidos en la muestra partido del tamaño de la muestra nos dará una idea de
la
probabilidad
de éxito). Podemos reescribir esta función de masa, multiplicando y dividiendo por
n
como:
t
n t 1
P(x1 , . . . , xn | θ) = θ (1 − θ)n−t
t n
t
Observemos que:
n
En el denorminador del segundo factor aparece que no depende del parámetro y que son
t
las formas de ordenar los t éxitos (combinaciones con repetición de n elementos tomados de t
en t).
Pθ (x1 , . . . , xn ∩ T = t)
Pθ (x1 , . . . , xn | T = t) =
Pθ (t)
La definición de estadístico suficiente es poco operativa, ya que necesitamos conocer de antemano el can-
didato a estadístico suficiente para, después comprobar si lo es. Por este motivo surge el siguiente teorema:
3.2
Sabemos que T (X1 , . . . , Xn ) = ∑ni=1 Xi es suficiente para la familia de funciones de distribución de Ber-
noulli de paramétro θ. Por definición, la función de masa conjunta de la muestra condicionada por el
−1
Pθ (x1 , . . . , xn ) n
estadístico no depende del parámetro, esto es Pθ (x1 , . . . , xn | T = t) = = =
Pθ (t) ∑ni=1 xi
3. No siempre coincide la dimensión del parámetro con la dimensión del estadístico suficiente.
4. Los estadísticos suficientes no son únicos e incluso pueden ser de dimensión diferente.
El teorema de factorización es útil para encontrar un estadístico suficiente: Basta factorizar la función de
densidad o masa conjunta de la muestra en dos partes: Una que no contenga el parámetro y la otra que
dependa de la muestra sólo a través de una función suya. Esta función será el estadístico buscado.
El teorema de factorización es poco operativo para demostrar que un estadístico no es suficiente. Es prefe-
rible usar el siguiente resultado:
Proposición 3.2
Dadas dos muestras (x1 , . . . , xn ) e (y1 , . . . , yn ) tales que T (x1 , . . . , xn ) = T (y1 , . . . , yn ). En estas condi-
fθ (x1 , . . . , xn )
ciones: Si depende de θ entonces T no es suficiente.
fθ (y1 , . . . , yn )
Proposición 3.3
Sea X1 , . . . , Xn una m.a.s. de una población U(θ1 , θ2 ) con θ1 < θ2 . La función de distribución conjunta
de la muestra es:
1
f(θ1 ,θ2 ) (x1 , . . . , xn ) = I (θ1 )I[x(n) ,∞) (θ2 )
(θ2 − θ1 )n (−∞,x(1) ]
Así,
Un estadístico define una única partición, pero a una partición se le pueden asociar varios
estadísticos.
3.5
χ espacio muestral
χ = {x = (x1 , . . . , xn ) : xi = {0, 1}}
T estadístico
m
T (x) = ∑ xi número de éxitos
i=1
T = {0, 1, 2, . . . , n}
At = {T −1 (t) : t ∈ T } es una partición de χ inducida por T .
{A0 , A1 , . . . , An }
Segunda definición:
Un estadístico suficiente T (x) se dice minimal si para cualquier otro estadístico suficiente S(x) se
tiene que T (x) es función de S(x). Es decir, si ocurre que S(x) = S(y) implica necesariamente que
T (x) = T (y).
Tercera definición:
Un estadístico es minimal suficiente si induce una partición minimal suficiente.
3.6
Consideramos una muestra de tamaño 3 de una población de Bernoulli de parámetro θ. Sabemos que
T (x1 , x2 , x3 ) = ∑3i=1 xi es un estadístico suficiente para θ. Por el teorema de factorización:
T S
(0,0,0) (0,0,0)
(0,0,1) (0,0,1)
(0,1,0) (0,1,0)
(1,0,0) (1,0,0)
(0,1,1) (0,1,1)
(1,0,1) (1,0,1)
(1,1,0) (1,1,0)
(1,1,1) (1,1,1)
T siempre tiene asociada una partición tal que las demás son subparticiones suyas.
El teorema de factorización, por lo general, conduce a estadísticos minimales suficientes, pero no asegura
tal propiedad. Además, la definición dada es imposible para tal fin. Se hace necesario otro mecanismo que
permita el cálculo de estadísticos minimales suficientes.
fθ (x1 , . . . , xn )
T (x1 , . . . , xn ) = T (y1 , . . . , yn ) ⇔ es independiente de θ
fθ (y1 , . . . , yn )
Como la distribucion de un estadístico ancilar no depende del parámetro, son los que re-
Estadístico ancilar para la familia de escala: Cualquier estadístico que dependa de la muestra sólo
X1 Xn−1
a través de n − 1 valores , . . . , es un estadístico ancilar.
Xn Xn
Teorema 3.4
Si T es un estadístico suficiente y completo para θ, entonces T es suficiente minimal.
V[X]=E[V[X|Y ]]+V[E[X|Y ]]
Demostración:
1. Teniendo en cuenta que f (x, y) = f (x|y) fY (y) y que EX [X|Y ] = R x f (x|y)dx
E[X] = x f (x, y)dxdy = x f (x|y)dx fY (y)dy =
R2 R R
= EX [X|Y ] fY (y)dy = EY [EX [X|Y ]]
R
Demostración:
Si U es ancilar para θ, entonces fU (u) no depende de θ y, por tanto, Eθ [ fU (u)] tampoco depende
de θ.
Llamamos g(t) = f (u) − f (u|T ) que no depende de θ, tomando esperanzas iteradas en ambos miem-
bros:
E[E[g(t)]] = E[E[ f (u)]] − E[E[ f (u|T )]]
El segundo sumando del segundo miembro es igual a E[ f (u)], por la ley de esperanzas iteradas.
Por tanto, E[g(t)] = 0 y como T es completo, g(t) = 0, luego f (u) = f (u|T ) así que U y T son inde-
pendientes.
Teorema 3.7
Sea { fθ : θ ∈ Θ} una familia exponencial k-paramétrica, esto es
Teorema 3.8
En las condiciones del teorema anterior y si, además, las funciones Qi , i = 1, . . . , k, son linealmente
independientes, entonces el estadístico k-dimensional (T1 (x1 , . . . , xn ), . . . , Tk (x1 , . . . , xn )) es minimal
suficiente para θ.
Teorema 3.9
Sea X1 , . . . , Xn una m.a.s. obtenida de una población con distribución exponencial k-paramétrica, en-
tonces:
i i
y, por tanto, el estadístico (T1∗ (x1 , . . . , xn ), . . . , Tk∗ (x1 , . . . , xn )) es suficiente. Si, además, las funciones
Qi , i = 1, . . . , k, son linealmente independientes, como en el caso anterior, el estadístico es minimal
suficiente.
Teorema 3.10
Para la familia de distribuciones exponencial k-paramétrica, si el espacio paramétrico natural contiene
un abierto no vacío de Rk , entonces el estadístico (T1∗ (x1 , . . . , xn ), . . . , Tk∗ (x1 , . . . , xn )) es completo.