Está en la página 1de 40

Intervalos de confianza casos general

Stalyn Guerrero1

1 Msc Ciencias estadı́stica universidad nacional sede Bogotá

Mayo de 2020

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 1 / 35


Contenido

1 Intervalos de confianza para una función del parámetro θ

2 Intervalos de confianza para poblaciones no normales

3 Intervalos de confianza para muestras grandes

4 Intervalos de confianza Bootstrap


Intervalos bootstrap t

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 2 / 35


Intervalos de confianza para una función del parámetro θ

Intervalos de confianza para g (θ)

Definición (IC bilateral)


Dada una muestra aleatoria con parámetro desconocido θ, que está en el
intervalo de confianza (Li , Ls ) de 100× (1 − α) %, entonces
• Sea g una función estrictamente creciente, entonces un intervalo de
confianza para g (θ) es (g (Li ) , g (Ls ))
• Sea g una función estrictamente decreciente, entonces un intervalo de
confianza para g (θ) es (g (Ls ) , g (Li ))

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 3 / 35


Intervalos de confianza para g (θ)

Definición (IC unilateral superior)


Dada una muestra aleatoria con parámetro desconocido θ, que está en el
intervalo de confianza (∞, Ls ) de 100× (1 − α) %, entonces
• Sea g una función estrictamente creciente, entonces un intervalo de
confianza para g (θ) es (∞, g (Ls ))
• Sea g una función estrictamente decreciente, entonces un intervalo de
confianza para g (θ) es (g (Ls ) , ∞)
Intervalos de confianza para g (θ)

Definición (IC unilateral superior)


Dada una muestra aleatoria con parámetro desconocido θ, que está en el
intervalo de confianza (∞, Ls ) de 100× (1 − α) %, entonces
• Sea g una función estrictamente creciente, entonces un intervalo de
confianza para g (θ) es (∞, g (Ls ))
• Sea g una función estrictamente decreciente, entonces un intervalo de
confianza para g (θ) es (g (Ls ) , ∞)

Definición (IC unilateral Inferior)


Dada una muestra aleatoria con parámetro desconocido θ, que está en el
intervalo de confianza (Li , ∞) de 100× (1 − α) %, entonces
• Sea g una función estrictamente creciente, entonces un intervalo de
confianza para g (θ) es (g (Li ) , ∞)
• Sea g una función estrictamente decreciente, entonces un intervalo de
confianza para g (θ) es (∞, g (Li ))
IC para Pob. no normales

Intervalos de confianza para poblaciones no normales

Inicialmente se deben definir las variables pivote para los parámetros de


escala y localización.
Definición (Parámetro de escala)
Sea X una variable aleatoria con función de densidad de probabilidad
fX (x), la cual depende de un parámetro θ, se dice que θ es un parámetro
de escala si la distribución de la variable X /θ o θX no depende de θ.

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 5 / 35


IC para Pob. no normales

Intervalos de confianza para poblaciones no normales

Inicialmente se deben definir las variables pivote para los parámetros de


escala y localización.
Definición (Parámetro de escala)
Sea X una variable aleatoria con función de densidad de probabilidad
fX (x), la cual depende de un parámetro θ, se dice que θ es un parámetro
de escala si la distribución de la variable X /θ o θX no depende de θ.

Definición (Parámetro de localización)


Sea X una variable aleatoria con función de densidad de probabilidad
fX (x), la cual depende de un parámetro θ, se dice que θ es un parámetro
de localización si la distribución de la variable X + θ o X − θ no depende
de θ.

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 5 / 35


IC para Pob. no normales

Intervalos de confianza para poblaciones no normales

Observación
Para probar que un parámetro es de escala, es necesario encontrar la
función de distribución de X /θ o θX .

Observación
Si fX (x) depende de más de un parámetro y se desea verificar que un
parámetro especifico sea de localización o escala, los demás parámetros se
consideran constantes.

Examples (Distribución normal)


Sea X una variable
 aleatoria con distribución N (µ, σ). Se tiene que
X − µ ∼ N 0, σ 2 , y por consiguiente, µ es un parámetro de localización.

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 6 / 35


IC para Pob. no normales

Intervalos de confianza para poblaciones no normales

Nota
Si se conoce la función de distribución de X , hay tres alternativas para
encontrar la distribución de X /θ o θX :
• Utilizar directamente la función de distribución o la función de
densidad cuando estas sean fáciles.
• Utilizar el teorema de la transformación cuando las funciones de
distribución y de densidad sean complicadas.
• Utilizar la función generadora de momentos.

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 7 / 35


IC para Pob. no normales

Intervalos de confianza para poblaciones no normales

Definición
Sea X1 , . . . , Xn una muestra aleatoria proveniente de una distribución con
función de densidad f (x, θ), y sea θ∗ el estimador de máxima verosimilitud
de θ, entonces
• Si θ es un parámetro de localización, entonces θ∗ − θ o θ∗ + θ es un
pivote para θ
• Si θ es un parámetro de escala, entonces θ∗ /θ o θ∗ θ es un pivote para
θ

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 8 / 35


IC para Pob. no normales

Intervalos de confianza para poblaciones no normales

Ejemplo (Distribución exponencial)


Sea X una variable aleatoria con distribución exp (θ) con E (X ) = θ.
Determine un intervalo de confianza para θ.

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 9 / 35


IC para Pob. no normales

Intervalos de confianza para poblaciones no normales

Ejemplo (Distribución exponencial)


Sea X una variable aleatoria con distribución exp (θ) con E (X ) = θ.
Determine un intervalo de confianza para θ.

Solución
Se tiene que Xθ ∼ exp (1) y por consiguiente, θ es un parámetro de escala.
Para encontrar la distribución de θ/X usamos directamente la función de
distribución como sigue:
  Z xθ
X 1 −t t xθ
FX /θ (x) = P ≤ x = P (X ≤ xθ) = e θ dt = e − θ 0
θ 0 θ
−x
= FX (θx) = 1 − e

que corresponde al función de distribución

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 9 / 35


IC para Pob. no normales

Intervalos de confianza para poblaciones no normales

Proposición
Si X1, , . . . , Xn son una muestra variables aleatorias independientes
proveniente de una población exp (θ), entonces Y = ni=1 Xi tiene
P
distribución Gamma (n, θ)

Ejercicio
Si X1, , . . . , Xn son una muestra variables aleatorias independientes
Pn
Xi
proveniente de una población exp (θ), entonces Y = i=1 θ tiene
distribución Gamma (n, 1)

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 10 / 35


IC para Pob. no normales

Intervalos de confianza para poblaciones no normales


Proof.
Dado que Xi ∼ exp (θ) entonces su función generadora de momentos está
dada por
1
mXi (t) =
1 − θt
luego,

mY (t) = mPni=1 Xi (t) = mX1 (t) × · · · × mXn (t)


   
1 1
= × ··· ×
1 − θt 1 − θt
 n
1
=
1 − θt

Que corresponde a la fgm de la función Gamma (n, θ)


Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 11 / 35
IC para Pob. no normales

Intervalos de confianza para poblaciones no normales


Recordemos que θ̂MV = X̄ , por lo tanto, X̄θ es una variable pivote para θ,
luego demos encontrar Li y Ls tales que
 

P Li ≤ ≤ Ls = 1−α
θ
 Pn 
i=1 Xi
P nLi ≤ ≤ nLs = 1−α
θ

Intervalo de confianza para θ


Haciendo los cálculos necesarios, se obtiene que el IC para θ es
!  
Pn Pn
i=1 Xi i=1 Xi 2nX̄ 2nX̄ 
, 0  2 , 2
Gamma (1, n)1− α Gamma (1, n) α χ 1− α ,2n χ α ,2n
2 2 ( 2 ) (2 )

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 12 / 35


IC para Pob. no normales

Intervalos de confianza para poblaciones no normales

Definición (Intervalo de confianza con distribución de Poisson)


Sea X1 , . . . , Xn variables aleatorias con distribución de Pois (λ) que
constituye una muestra aleatoria. Garwood (1936) Propone P construir el
intervalo de confianza para λ usando la estadı́stica Y = Xi cuya
distribución es Pois (nλ) y con algunos desarrollos llega al intervalo
 
1 2 1 2
χ , χ
2n 2y0 ,α/2 2n 2(y0 +1),1−α/2

En el caso de que y0 se toma χ22y0 ,α/2 = 0, y el limite inferior del anterior


intervalo será 0

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 13 / 35


Intervalos de confianza para muestras grandes

Intervalos de confianza para muestras grandes

Si el tamaño muestral n es suficentemente grande, se puede hacer uso de


las propiedades asintóticas de los estimadores estudiados previamente.
Definición (Intervalos de confianza para un parámetro θ cualquiera)
Para determinar el intervalo de confianza de un parámetro θ, siempre que
el tamaño de la muestra sea grande , se puede partir del estimador de
máxima verosimilitud.
El estimador MV es asintóticamente insesgado, asintóticamente eficiente y
tiene una distribución asintóticamente normal
r  !
d
θ→N θ, V θ̂

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 14 / 35


Intervalos de confianza para muestras grandes

Intervalos de confianza para muestras grandes


La varianza asintótica coincide con el inverso de la información de Fisher,
  1
V θ̂ = [I (θ)]−1 =  2
nE ∂ ln ∂θ
f (x;θ)

de donde se define la cantidad pivotal


θ̂ − θ d
T (X; θ) = r   → N (0, 1)
V θ̂

luego, el intervalo de confianza


 r   r  
θ̂ − k V θ̂ , θ̂ + k V θ̂

 
Si V θ̂ no se conoce, podemos usar su estimación.

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 15 / 35


Intervalos de confianza para muestras grandes

Intervalos de confianza para muestras grandes

Ejemplo (Distribución exponencial)


Una población con distribución exponencial dada por
1 −x
e θ,x ≥ 0
f (x; θ) =
θ
se extrae una muestra de tamaño n = 100 donde ni=1 xi = 214,
P
determine el intervalo de confianza del 90% para el parámetro θ.

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 16 / 35


Intervalos de confianza para muestras grandes

Intervalos de confianza para muestras grandes

Ejemplo (Distribución exponencial)


Una población con distribución exponencial dada por
1 −x
e θ,x ≥ 0
f (x; θ) =
θ
se extrae una muestra de tamaño n = 100 donde ni=1 xi = 214,
P
determine el intervalo de confianza del 90% para el parámetro θ.

Solución
 
θ2
Sabemos que el estimador θ̂MV = x̄ con V θ̂MV = n, la estimación de
la varianza está dada por
  x̄ 2
V̂ θ̂MV =
n
Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 16 / 35
Intervalos de confianza para muestras grandes

Intervalos de confianza para muestras grandes

Solución (Continuando)
 
Para la muestra obtenida tenemos que x̄ = 2.14 y V̂ θ̂MV = 0.045796,
luego un intervalo de confianza al 90% para θ viene dado por
 √ √ 
2.14 − 1.64 0.045796 , 2.14 + 1.64 0.045796
[2.105, 2.491]

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 17 / 35


Intervalos de confianza Bootstrap

Intervalos de confianza Bootstrap

• En el campo de los intervalos de confianza existen diferentes técnicas


bootstrap y es un área de desarrollo teórico en evolución constante
• La técnica de bootstrap consiste en obtener la distribución de un
estadı́stico (al menos de forma aproximada) utilizando la información
que se deriva de una sola muestra (y sus réplicas).
• El bootstrap se puede usar para mejorar los intervalos de confianza;
de hecho, cuando n es muy grande los intervalos bootstrap y los
aproximados convergen a los mismos valores.

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 18 / 35


Intervalos de confianza Bootstrap

Intervalos de confianza Bootstrap


• Sea X1 , . . . Xn una muestra aleatoria de una distribución desconocida
F.
• Si el tamaño muestral n es grande  la
 distribución de θ̂ converge a una
normal de media θ y varianza V θ̂ , es decir
b

θ̂ − θ
r   ∼ N (0, 1)
Vb θ̂

• De este modo, se obtiene un intervalo de confianza estándar con


probabilidad 1 − α
 r   r  
θ̂ − z1− α2 V̂ θ̂ , θ̂ + z1− α2 V̂ θ̂

donde z α2 es el valor que proviene de la distribución normal estándar.


Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 19 / 35
Intervalos de confianza Bootstrap

Intervalos de confianza Bootstrap

Ejemplo
Sea X1 , . . . X30 una muestra aleatoria proveniente de una población
exponencial dada por
1 −x
f (x; θ) = e 10 , x ≥ 0
10
determine el intervalo de confianza Bootstrap del 95% para el parámetro θ.
> set.seed(123)
> n = 30; theta = 1/10
> x <- rexp(n, theta); round(x,2)
[1] 8.43 5.77 13.29 0.32 0.56 3.17 3.14 1.45 27.26 0.
[13] 2.81 3.77 1.88 8.50 15.63 4.79 5.91 40.41 8.43 9.
[25] 11.69 16.06 14.97 15.71 0.32 5.98
>
Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 20 / 35
Intervalos de confianza Bootstrap

Intervalos de confianza Bootstrap

> set.seed(123)
> Ftheta <- function(x){
+ xi <- sample(x, length(x), replace = TRUE); mean(xi) }
> thetai <- replicate(1000, Ftheta(x))

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 21 / 35


Intervalos de confianza Bootstrap

Intervalos de confianza Bootstrap

0.2
^ ^ 
f θ

0.1

0.0
5.0 7.5 10.0 12.5 15.0
θ^b

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 22 / 35


Intervalos de confianza Bootstrap

Intervalos de confianza Bootstrap



●● ●

●●

●●●●
●●
●●

●●



●●

●●

●●

●●
12 ●●

●●

●●




●●


●●



●●

●●




●●



●●



●●

●●


●●


●●

●●

●●

●●





●●



●●




●●

●●
●●

●●


●●


●●
θ^

●●


●●


9 ●

●●



●●


●●


●●


●●
●●


●●

●●


●●

●●


●●


●●





●●





●●


●●


●●



●●


●●


●●

●●

●●
●●




●●


●●

●●




●●

●●



●●
●●

●●


●●

●●

6 ●●●
●●

●●●
●●●
●●

−2 0 2
θ

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 23 / 35


Intervalos de confianza Bootstrap

Intervalos de confianza Bootstrap

> PTheta = mean(thetai); hatV <- var(thetai)


> Alpha <- 0.05;
> Alpha <- c (LimInf = 1 - Alpha /2 , LimSup = Alpha/2)
> ICBoot <- sapply ( Alpha ,
+ function ( Alpha ) PTheta - qnorm(Alpha)*sqrt(hatV))
> ##################################################
> media = mean(x)
> ICExacto <- sapply ( Alpha ,
+ function ( Alpha ) (2*n* media )/ qchisq ( Alpha ,2*n ))

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 24 / 35


Intervalos de confianza Bootstrap

Intervalos de confianza Bootstrap

LimInf LimSup Lon


ICExacto 6.56 13.51 6.94
ICBoot 6.05 12.09 6.04

¿Qué se concluye?

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 25 / 35


Intervalos de confianza Bootstrap

Intervalos de confianza Bootstrap

LimInf LimSup Lon


ICExacto 6.56 13.51 6.94
ICBoot 6.05 12.09 6.04

¿Qué se concluye?
Ejercicio
Para la muestra X1 , . . . X30 construir un intervalo de confianza para la
mediana.

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 25 / 35


Intervalos de confianza Bootstrap

Intervalos de confianza Bootstrap

30

20
^ ^ 
f θ

10

0
0.050 0.075 0.100 0.125 0.150
θ^b

¿El gráfico muestra una tendencia normal?


Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 26 / 35
Intervalos de confianza Bootstrap

Intervalos de confianza Bootstrap



0.15




●●

0.12 ●●
●●


●●
●●

●●

●●


●●


●●





●●

●●


●●


●●



●●


●●


●●


●●




●●


θ^




●●




0.09 ●





●●


●●

●●

●●





●●

●●



●●

●●



●●


●●



●●






●●




●●


●●




●●


●●



●●

●●


●●


●●

●●



●●



●●


●●





●●

●●


●●
●●


●●



●●

●●


●●
0.06 ●

●●


●●


●●

●●

●●



●●


●●

●●


●●
●●

●●
●●

●●●●●
● ● ●●●

0.03
−2 0 2
θ

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 27 / 35


Intervalos de confianza Bootstrap

Intervalos de confianza Bootstrap

Shapiro-Wilk normality test

data: thetai
W = 0.96951, p-value = 1.229e-13
Dado que p − valor ≤ 0.05, entonces se rechaza la hipótesis de normalidad,
por lo tanto, los observaciones no siguen una distribución normal.

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 28 / 35


Intervalos de confianza Bootstrap Intervalos bootstrap t

Intervalos bootstrap t

• Usando el bootstrap se pueden obtener intervalos ajustados sin


necesidad de asumir normalidad en los datos.
• Los intervalos que se construyen reciben el nombre de aproximación
bootstrap-t.
• En este método se calcula una tabla de cuantiles de t directamente a
partir de los datos que se tienen.
• Esta tabla se usa entonces para construir intervalos de confianza de la
misma manera que en el caso de los intervalos clásicos.

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 29 / 35


Intervalos de confianza Bootstrap Intervalos bootstrap t

Intervalos bootstrap t
• El método consiste en generar B muestras bootstrap X∗1 , . . . , X∗B . A
continuación, para cada una de ellas se calcula

θ̂∗ − θ̂
Zb∗ = rb  
V̂ θ̂b∗

∗ ∗
donde,
r  θ̂ b a la estimación de θ obtenida a partir de Xb y
 
V̂ θ̂b∗ = seb θ̂b∗ es el valor estimado del error estándar de θ
obtenida a partir de X∗b
• El α-esimo percentil de Zb∗ se estima mediante el valor t̂α tal quec

# Zb∗ ≤ t̂α

= α
B
Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 30 / 35
Intervalos de confianza Bootstrap Intervalos bootstrap t

Intervalos bootstrap t

• De este modo, el estimador bootstrap-t que queda es


 r   r  
θ̂ − t̂1−α × V̂ θ̂ , θ̂ + t̂α × V̂ θ̂

• Es necesario considerar un número de réplicas B mayor que en el caso


del cálculo de los errores estándar bootstrap.
• Por otro lado, los percentiles bootstrap-t pueden diferir bastante de
los percentiles t de Student habituales.

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 31 / 35


Intervalos de confianza Bootstrap Intervalos bootstrap t

Intervalos bootstrap t

> Ftheta3 <- function(x){


+ xi <- sample(x, length(x), replace = TRUE)
+ (mean(xi)-mean(x)) / (mean(xi)/sqrt(length(x)) ) }
> set.seed(123)
> thetai <- replicate(5000, Ftheta3(x))
> quantile(thetai, 1-Alpha)
2.5% 97.5%
-2.446544 1.488940
> qt(1-Alpha, n-1)
LimInf LimSup
-2.04523 2.04523

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 32 / 35


Intervalos de confianza Bootstrap Intervalos bootstrap t

Intervalos de confianza Bootstrap


Linea azul son los cuantiles de la distribución tn−1 y la linea negra son los
empı́ricos obtenidos mediante bootstrap.

1.00
Acumulada empírica

0.75

0.50

0.25

0.00
−2 0 2
t
Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 33 / 35
Intervalos de confianza Bootstrap Intervalos bootstrap t

Intervalos de confianza Bootstrap

LimInf LimSup Lon


ICExacto 6.56 13.51 6.94
ICBoot 6.05 12.09 6.04
ICT 6.47 11.75 5.28
ICTboot 7.19 12.27 5.08

¿Qué se concluye?

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 34 / 35


Lecturas adicionales

Bibliografı́a

Garwood, F. (1936). Fiducial limits for the Poisson distribution.


Biometrika, 28(3/4), 437-442.

Stalyn Guerrero (UNAL) Intervalos de confianza casos general Mayo de 2020 35 / 35

También podría gustarte