Está en la página 1de 9

Estadística Matemática 5.

Intervalos y regiones de confianza

5 Intervalos y regiones de confianza


Cuando se estima un parámetro usualmente no es suficiente un valor puntual, sino que se
necesita una idea concreta de la inertidumbre que tiene este valor. Esto se consigue con
la expresión de intervalos o regiones de confianza que se definen a continuación.
Definición 23. Sea X = (X1 , . . . , Xn ) un vector aleatorio con distribución conjunta Pθ ,
θ ∈ Θ ⊂ R, Sean dos funciones medibles L y U con L(X) < U (X), al intervalo aleatorio
[L(X), U (X)] se denomina intervalo de confianza de nivel 100p % para θ si

Pθ [L(X) ≤ θ ≤ U (X)] ≥ p

para cualquier valor de θ y con igualdad en en al menos un valor de θ.


En algunos casos se tiene al igualdad para todo theta

Pθ (L(X) ≤ θ ≤ U (X)) = p, ∀θ ∈ Θ.

También se pueden definir intervalos unilaterales si se reemplaza la ecuación adecuadamente


por
Pθ (θ ≥ L(X)) ≥ p ó Pθ (θ ≤ U (X)) ≥ p.

Resolver las ecuaciones propuestas de forma exacta es posible en muy pocas ocasiones,
muchas veces solo se dispone de aproximaciones asintóticas que pueden ser el resultado
por ejemplo de la aplicación del teorema central de límite, en ese caso, si la muestra es
suficientemente grande, se tiene que

Pθ (L(X) ≤ θ ≤ U (X)) −→ p, sin → ∞.

Veamos algunos ejemplos

Ejemplo 62. Sea X1 , . . . , Xn una muestra i.i.d. de un distribución N (µ, 1), sabemos que

n(X n − µ) ∼ N (0, 1),

luego


!
1.96 1.96
0, 95 = Pµ (−1, 96 ≤ n(X n − µ) ≤ 1, 96) = Pµ Xn − √ ≤ θ ≤ Xn + √
n n

5.1 Método Pivotal


Se presenta un método que permite construir intervalos de confianza a partir de los que
se denomina raíz pivotal o pivote.

Carlos Almeida 10 de agosto de 2020 73


Estadística Matemática 5. Intervalos y regiones de confianza

Sea un vector aleatorio X = (X1 , . . . , Xn ) con distribución Pθ , una raíz pivotal es una
función medible del vector aleatorio g(X1 , . . . , Xn ; θ) tal su distribución no depende de θ.
i.e.
Pθ (g(X1 , . . . , Xn ; θ) ≤ x) = G(x).
Así, se pueden obtener constantes a y b tales que
p = Pθ (a ≤ g(X1 , . . . , Xn ; θ) ≤ b) = G(b) − G(a−).
El evento {a ≤ g(X1 , . . . , Xn ; θ) ≤ b} podría ser manipulado álgebraicamente para
expersarlo de la forma
p = Pθ (L(X1 , . . . , Xn ) ≤ θ ≤ U (X1 , . . . , Xn )).

Ejemplo 63. Sea X1 , . . . , Xn una muestra i.i.d. de una distribución U(0, θ), el estimador
de máxima verosimilitud es θ̂n = X(n) y sabemos que
!
X(n)
Pθ ≤ x = xn , 0 ≤ x ≤ 1.
θ
X(n)
Es claro que θ
es una raíz pivotal, se elige a y b tales que
!
X(n)
p = Pθ a≤ ≤ b = b n − an .
θ

Existe una infinidad de selecciones posibles de a y de b. Sin embargo si b = 1 y a = (1−p)1/n


define el intervalo más pequeño, entonces el intevalo de confianza del nivel 100p % más
pequeño es: " #
X(n)
X(n) , .
(1 − p)1/n

Ejemplo 64. Sea X1 , . . . , X10 una muestra i.i.d. de una distribución exponencial Exp(λ)
construyamos un intervalo de confianza del 90%.
10
X
Se verifica que λ Xi ∼ Gamma(10, λ), entonces es una raíz pivotal, encontremos a y b
i=1
tales que
10
!
X
Pλ a ≤ λ Xi ≤ b = 0.90.
i=1
Existe una infinidad de valores a y b que satisfagan esta ecuación, por facilidad suele
usarse:
10 10
! !
X X
Pλ λ Xi < a = 0.05, Pλ λ Xi > b = 0.05.
i=1 i=1

Carlos Almeida 10 de agosto de 2020 74


Estadística Matemática 5. Intervalos y regiones de confianza

Que da de fora aproximada:


" #
5, 425 15.705
[L(X), U (X)] = P10 , P10 .
i=1 Xi i=1 Xi

No es el intervalo de confianza para θ más pequeño, pero en este contexto es el más usado.

5.2 Estimación de subparámetros


Suele necesitarse la estimación de un subparámetro, en este contexto la idea es la misma
y se realiza de la siguiente forma:
θ = (θ1 , . . . , θp ) y se construye una raíz pivotal g(x1 , . . . , xn ; θ1 ) para el subparámetro de
interés θ1 , (i.e. la distribución de g(X1 , . . . , Xn ; θ1 ) no depende de θ.
Pθ (g(X, θ1 ) ≤ x) = G(x).
Se aplica el mismo procedimiento que antes, mostremos un ejemplo clásico.

Ejemplo 65. Sea X1 , . . . , Xn una muestra i.d.d. de una distribución normal N (µ, σ 2 ).
Sea n
1 X
S2 = (Xi − X n )2 .
m − 1 i=1
Se conoce que

n(X n − µ)
∼ tn−1 , que no depende de µ ó de σ 2 .
S
Así, es una raíz pivotal para µ y entonces el intervalo de confianza de nivel (1 − α)100%
está dado por
" #
S S
[L(X), U (X)] = X n − √ tn−1,α/2 , X n + √ tn−1,α/2 .
n n

También se tiene que


n
(n − 1)S 2 1 X
= (Xi − X n )2 ∼ χ2n−1
σ2 σ 2 i=1

que se observa que es una raíz pivotal para σ 2 , un intervalo de confianza está dado por
 
(n − 1)S 2 (n − 1)S 2 
[L(X), U (X)] =  2 , .
χn−1,α/2 χ2n−1,(1−α/2)

Carlos Almeida 10 de agosto de 2020 75


Estadística Matemática 5. Intervalos y regiones de confianza

El método pivotal también se puede aplicar cuando se tienen aproximaciones asintóticas,


por ejemplo si se aplica el teorema central de límite, se pude tener que

Pθ [g(X, θ) ≤ x) ≈ G(x).

Para ilustrar supongamos que disponemos de un estimador θ̂ de θ tal que:

θ̂ − θ a
∼ N (0, 1), es una raíz pivotal aproximada.
σ(θ)
 
θ̂ − θ
Pθ −zp/2 ≤ ≤ zp/2  ≈ 1 − p,
σ(θ)
por tanto, un intervalo de confianza aproximado de nivel (1 − p)100% está dado por:
h i
θ̂ − σ(θ̂)zp/2 , θ̂ + σ(θ̂)zp/2

Observe que la aproximación no es única, y puede haber pequeñas diferencias. Veamos un


ejemplo.

Ejemplo 66. Sea X1 , . . . , Xn una muestra i.d.d. de una distribución exponencial Exp(λ).
Primera aproximación:
1
El estimados de máxima verosimilitud de λ es λ̂n = , se tiene entonces que:
Xn
√ a
n(λ̂n − λ) ∼ N (0, λ2 ).

Asi, para n suficientemente grande


   
√ λ̂n − λ 
Pλ −1, 96 ≤ n  ≤ 1, 96 ≈ 0, 95,
λ

con lo que un intervalo de confianza aproximado del 95% está dado por
 
λ̂n λ̂n
 √ , √ .
1 + 1, 96/ n 1 − 1, 96/ n

Segunda aproximación:
Se tiene también, usando el teorema de Slutsky que
 
√ λ̂ − λ  a
n  n ∼ N (0, 1),
λ̂n

Carlos Almeida 10 de agosto de 2020 76


Estadística Matemática 5. Intervalos y regiones de confianza

que también sera una raíz pivotal aproximada, y así el intervalo de confianza es:
h √ √ i
λ̂n (1 − 1, 96/ n), λ̂n (1 + 1, 96/ n), .

Tercera aproximación:
Aplicando el método delta a la distribución asintótica del estimador de máxima verosimil-
itud se tiene que √ a
n(log(λ̂n ) − log(λ)) ∼ N (0, 1).
El intervalo de confianza aproximado de nivel 95% para log(λ) es
h √ √ i
log(λ̂n ) − 1, 96/ n, log(λ̂n ) + 1, 96/ n

que corresponde al intervalo de confianza aproximado de nivel 95% para λ:


h √ √ i
λ̂n exp(−1, 96/ n), λ̂n exp(1, 96/ n)

Las tres aproximaciones dan resultados diferentes, pero asintóticamente coinciden.

A la tergera aproximación se conoceccomo de estabilización de la varianza y en algunos


casos puede aplicarse de forma más general, supongamos que tenemos una aproximación
de la forma √ a
n(θ̂n − θ) ∼ N (0, σ(θ)2 ),
aplicando el método delta con una función suficientemente regular se tiene que
√ a
n(g(θ̂n ) − g(θ)) ∼ N (0, (g 0 (θ))2 σ(θ)2 ).

La transformación que estabiliza la varianza es g tal que g 0 (θ)σ(θ) = 1 y el intervalo de


confianza aproximado de nivel (1 − p)100% para g(θ) es
h √ √ i
g(θ̂n ) − zp/2 / n, g(θ̂n ) + zp/2 / n .

Si g es creciente, para θ el intervalo de confianza aproximado de nivel (1 − p)100% es


h √ √ i
g −1 (g(θ̂n ) − zp/2 / n), g −1 (g(θ̂n ) + zp/2 / n) .

5.3 Regiones de confianza


Si un parámetro es multidimensional, y se quiere tener una idea de donde están los
verdaderos valores de los parámetros debemos hablar de regiones, así tenemos la siguiente
definición.

Carlos Almeida 10 de agosto de 2020 77


Estadística Matemática 5. Intervalos y regiones de confianza

Definición 24. Sea el vector aleatorio X = (X1 , . . . , Xn ) con distribución Pθ , y θ ∈ Θ ⊂


Rp . R(X) ⊂ Rp es una región de confianza de nivel 100p% si

Pθ (θ ∈ R(X)) ≥ p para todo θ ∈ Θ,

con igualdad para al menos un valor θ ∈ Θ.


Hagamos un par de observciones:
• R(X) es un elemento aleatorio y no θ.
• R(X) no necesariamente es conexo, aunque es lo más común, porque en caso contrario
puede ser más difícil de interpretar.
Aquí también puede aplicarse el método pivotal, como resultado se tiene que la geometría
de la región que en general no es rectangular.

Ejemplo 67. Sea X1 , . . . , Xn una muestra i.i.d. de una distribución normal multivariante
Nk (µ, Σ), con Σ no singular. Los estimadores insesgados de µ y Σ son respectivamente
n n
1X 1 X
µ̂ = , Σ̂ = (Xi − µ̂)(Xi − µ̂)>
n i=1 n − 1 i=1

En este caso se tiene al función pivotal:

n(n − k)
g(µ̂, Σ̂; µ) = (µ̂ − µ)> Σ̂−1 (µ̂ − µ) ∼ Fk,n−k .
k(n − 1)

Sea fp el p-cuantil de Fn−k,n−k , entonces


( )
n(n − k)
R(µ̂, Σ̂) = µ ∈ R : p
(µ̂ − µ)> Σ̂−1 (µ̂ − µ) ≤ fp .
k(n − 1)

Alternativamente, si n es suficientemente grande


a
g ∗ (µ̂, Σ̂; µ) = n(µ̂ − µ)> Σ̂−1 (µ̂ − µ) ∼ χ2k ,

entonces n o
R∗ (µ̂, Σ̂) = µ ∈ Rp : n(µ̂ − µ)> Σ̂−1 (µ̂ − µ) ≤ cp ,
con cp el p-cuantil de χ2k es una región de confianza aproximada en sentido asintótico.

Se observa en el ejemplo que la geometría de las regiones no siempre es fácil de interpretar,


una alternativa puede ser fijar esta geometría como rectángulos.
Supongamos que θ ∈ Rk y [Li , Ui ] intervalo de confianza de nivel 100pi para θi , i = 1, . . . , k.

Carlos Almeida 10 de agosto de 2020 78


Estadística Matemática 5. Intervalos y regiones de confianza

Se define
n
[Li (X), Ui (X)] = {θ ∈ Rk : Li (X) ≤ Ui (X), i = 1, . . . , k},
Y
R(X) =
i=1

una región de confianza para θ, pero su cobertura no es clara. Lo que si se conoce, por la
desigualdad de Bonferroni es que
k
X k
X
Pθ (θ ∈ R(X)) ≥ 1 − Pθ (θi ∈ [Li (X), Ui (X)]) = 1 − (1 − pi ).
i=1 i=1

Así, si deseamos una cobertura (nivel) de al menos p podemos construir intervalos de


confianza unidimensionales para cada subparámetro de nivel

pi = 1 − (1 − p)/k.

Esta construcción nos da regiones de confianza de Bonferroni.


Ejercicio 9. Sea {(Yi , Zi ) : i = 1, . . . , n} una muestra i.i.d. de una distribución normal
N2 (0, σ) y sea el subparámetro ρ, el coeficiente de correlación entre Y e Y . Construya un
intervalo asintótico de nivel (1 − α) basado en la correlación empírica
n
1 1 X
ρ̂ = q (Yi − Y )(Xi − Y ).
n − 1 Sy2 Sz2 i=1

5.4 Regiones de Credibilidad (en sentido Bayesiano)


Cuando se cambia de paradigma, y se considera un modelo bajo la óptica Bayesiana, algo
parecido a intervalos o regiones de confianza puede desarrollarse, e este caso se habla de
intervalos o regiones de credibilidad, para presentar esto primero definamos claramente lo
que es un modelo Bayesiano y en general como se haría inferencia en este contexto.
Definición 25. Consideremos un modelo estadístico (Ω, A), {Pθ : θ ∈ Θ}, Al conjunto
paramétrico se le dota de una estructura de medibilidad (i.e. (Θ, BΘ ) es un espacio
medible) y se define una medida de probabilidad sobre el espacio paramétrico, llama
modelo Bayesiano al modelo de probabilidad definido por

(Ω × Θ, A × BΘ , Q),

donde A × BΘ es la σ-álgebra producto (i.e. la σ-álgebra generado por los rectángulos), y


la medida Q la extensión de la medida definida por:
Z
Sean A ∈ , B ∈ BΘ , Q(B × A) = M ⊗ Pθ (B × A) = Pθ (A) dM (θ)
B

Con cieta licencia se puede escribir:


• X | θ ∼ Pθ , suele llamarse modelo de muestreo.

Carlos Almeida 10 de agosto de 2020 79


Estadística Matemática 5. Intervalos y regiones de confianza

• θ ∼ M , usualmente denominado medida a-priori


Z
M ⊗ Pθ (B × A) = Pθ (X ∈ A) dM (θ)
B

Puede verificarse que Q es una medida de probabilidad sobre esl espacio producto (obser-
vaciones por parámetros), Se puede marginalizar (integrar) de la siguiente forma
Z
Para A ∈ A, P (A) = Q(Θ × A) = Pθ (X ∈ A) dM (θ).
Θ

Se verifica que P es una medida de probabilidad sobre el espacio muestral (Ω, A), a ésta
se la conoce como medida predictiva.
Bajo condiciones de regularidad (que no se tratarán aquí) existe una transición de
probabilidad tal que
Q = M ⊗ Pθ = P ⊗ Mx ,
donde Mx está definida de tal forma que:
Z
P ⊗ Mx (A × B) = Mx (B) dP (x).
A

A Mx se denomina medida a-posteriori.


Conceptualmente, Se conoce algo sobre los parámetros (M ), se observan los datos (Pθ ), y
se corrige lo que se conoce acerca de los parámetros a la luz de los datos observados (Mx ).
Entonces se entiende que toda inferencia sobre los parámetros a partir de los datos
observados debe verse como características de la medida Mx , y que no cambiará si no
cambian los datos.
Así, tenemos la siguiente definición:
Definición 26. Dado un modelo Bayesiano, se llama región de credibilidad de nivel p al
conjunto C(x) tal que:
Q(C(x) | X = x) : Mx (C(x)) = p.

Si tanto el modelo de muestreo como la distribución a-priori son dominados por medidas
σ-finitas µ y λ respectivamente se tiene que
dPθ dM
pθ (x1 , . . . , xn ) = (x1 , . . . , xn ), m(θ) = (θ).
dµ dλ

Se verifica que Q es tambien dominado por la medidad producto µ ⊗ λ y:

d(M ⊗ Pθ )
q(x1 , . . . , xn , θ) = (x1 , . . . , xn , θ) = pθ (x1 , . . . , xn ) m(θ).
d(µ ⊗ λ)

Carlos Almeida 10 de agosto de 2020 80


Estadística Matemática 5. Intervalos y regiones de confianza

Bajo condiciones de regularidad, se puede escribir


dP dMx
p ( x1 , . . . , x n ) = (x1 , . . . , xn ), mx (θ) = (θ).
dµ dλ
y se tiene que:
pθ (x1 , . . . , xn ) m(θ) = mx (θ)p(x1 , . . . , xn ).
y una región de credibilidad de nivel p estará dada por
Z
mx (θ) dθ = p.
C(x)

Por una cuestión de claridad, a veces se prefiere la notación:


• p(x1 , . . . , xn | θ) = pθ (x1 , . . . , xn )
• m(θ | x1 , . . . , xn ) = mx (θ)

Ejemplo 68. Sea X1 , . . . , Xn una muestra de una distribución de Poisson P o(θ), entonces
Pn
i=1 Xi ∼ P o(nθ), y sea la distribución a-priori θ ∼ Gamma(λ, α), es decir

λα θα−1 exp{−λθ}
m(θ) = , θ > 0,
Γ(α)
Pn
sea t = i=1 xi , por tanto

λα θα−1 exp{−λθ} exp{−nθ}(nθ)t


pθ (x1 , . . . , xn ) m(θ) =
Γ(α)t!
α α−1+t t
λ θ n exp{−(λ + t)θ}
= .
Γ(α)t!

De donde se tiene que

m(θ | x1 , . . . , xn ) = Kθα−1+t exp{−(λ + t)θ}.

Por tanto, θ | X1 , . . . , Xn ∼ Gamma(α + T, λ + n), que puede usarse para una estimación
de θ, por ejemplo
α+T
θ̂ = E(θ | X1 , . . . , Xn ) = ,
λ+n
también se puede tener un intervalo de credibilidad resolviendo la ecuación
Z b
m(θ | x1 , . . . , xn ) dθ = p.
a

Carlos Almeida 10 de agosto de 2020 81

También podría gustarte