Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Stat 04
Stat 04
Vimos en el captulo anterior mtodos de estimacin puntual. Pero no podemos esperar que la estimacin
que produce coincida exactamente con el verdadero valor del parmetro desconocido . Aqu buscamos
entonces construir un intervalo [ 1 , 2 ] tal que la probabilidad que est en el intervalo sea alta.
Esta probabilidad tiene diferente interpretacin segn estemos en el caso bayesiano o no. Se tiene entonces
dos clases de mtodos para construir estos intervalos.
En el caso bayesiano, el intervalo tiene una interpretacin inmediata a partir de la distribucin a posteriori de
. Lo nico inconveniente es la falta de unicidad de tal intervalo. Pero es natural buscar el intervalo de
largo mnimo.
Se define entonces un intervalo [ 1 , 2 ] de probabilidad 1 fijada a priori con pequeo, tal que
P( [ 1 , 2 ]) = 1 , calculada a partir de la distribucin .
En el caso de estimacin no bayesiana, el parmetro no se considera como una variable aleatoria. En este
caso es el intervalo [ 1 , 2 ] que es aleatorio, y se habla de la probabilidad de que el parmetro cubre el
intervalo. Los valores 1 y 2 son entonces funciones de los valores muestrales.
Sean X 1 , X 2 ,..., X n valores muestrales de X, se tiene que encontrar dos funciones 1 = t1 ( X 1 , X 2 ,..., X n ) y
2 = t 2 ( X 1 , X 2 ,..., X n ) tales que :
P( [ 1 , 2 ]) = 1
siendo la cantidad 1 fijada a priori y llamada el nivel de confianza. Generalmente se determinan las
funciones t 1 y t 2 a partir de un estimador de .
43
N. LACOURLY
Luego si P( u 1 Z u 2 ) = 1 , [ X n u 2 , X n u1 ] define un intervalo para de nivel de
n n
confianza 1 .
Hay una infinidad de intervalos de mismo nivel de confianza 1 . Pero se puede mostrar que el intervalo
de la forma [ X n u , X n + u ] , simtrico con respecto a X n , tiene el largo mnimo entre los intervalos de
mismo nivel de confianza igual a 1 . Por ejemplo, para = 0.05 , se obtiene el intervalo
[ X n 1.96 , X n + 1.96 ].
n n
Si no se supone que la varianza 2 es conocida, se tiene que usar un estadstico cuya distribucin muestral
no depende de 2 . Eso nos lleva a usar el estadstico
n( X n )
T=
( X i X n ) 2 /( n 1 )
( X i X n )2
1
El estadstico T puede escribirse en funcin del estimador sesgado S n2 = de 2 :
n i
Xn X
( X i X n )2 : T = ~ n /
1
T= o del estimador insesgado ~ n2 = .
Sn / n 1 n 1 i n n
~ ~
Si P( t 1 T t 2 ) = 1 , [ X n + t 1 , X n + t2 ] define un intervalo para de nivel de confianza
n n
1 .
U=
( X i X n )2 ~ 2 se construye un intervalo de nivel de confianza 1 a partir de
n 1 ,
2
P( u 1 U u 2 ) = P
( X i X n )2 2 ( X i X n )2 = 1
u2 u1
44
4. ESTIMACIN POR INTERVALO
Si las varianzas son conocidas entonces un intervalo para = 1 2 esta dado por:
12 22 2 2
[ X1 X2 u
+ ,X1 X2 + u 1 + 2 ]
n1 n2 n1 n2
en donde u se determina a partir de las tablas de la distribucin normal segn el nivel de confianza 1 .
Si las varianzas no son conocidas, para encontrar un estadstico que nos sirve y cuya distribucin no depende
de estas varianzas, hay que hacer alguno supuesto suplementario. En efecto si tomamos como estimador de
12 22
la varianza de la diferencia + con 12 y 22 las respectivas varianzas muestrales sesgadas,
n1 n2
n1 12 n 2 22
+ ~ n21 + n2 2 y
12 22
12 22
( X1 X2 ) / +
n1 n2
~ t n1 + n2 2
n1 12 n 2 22
+ /( n1 + n 2 2 )
12 22
que depende de las varianzas desconocidas 12 y 22 .
Si se supone que estas varianzas son proporcionales: 22 = k 12 , entonces se tiene un estadstico que no
depende de 12 y 22 . Usualmente se toma k=1:
( X1 X2 )
~ t n1 + n2 2
n 2 + n 2 22 n1 + n 2
( 1 1 )( )
n1 + n 2 2 n1 n 2
n1 12 n 2 22
El estadstico ~ n21 1 y el estadstico ~ n22 1 , siendo estos independientes.
12 22
45
N. LACOURLY
sU
Si U ~ r2 y V ~ s2 y son independientes, entonces se dice que Y = sigue una distribucin de F de
rV
Fisher a r y s grados de libertad denotada Fr ,s con una funcin de densidad igual a:
(( r + s ) / 2 )r r / 2 s s / 2 y ( r 2 ) / 2
h( y ) = y > 0
( r / 2 ) ( s / 2 )( ry + s )( r + s ) / 2
En efecto, como U y V son independientes, se puede calcular fcilmente la funcin de densidad conjunta de
(U,V):
u ( r 2 ) / 2 e u / 2 v ( s 2 ) / 2 e v / 2
f ( u ,v ) = r / 2 u > 0 , v > 0
2 ( r / 2 )2 s / 2 ( s / 2 )
Con el cambio de variables (U,V) (Y,Z) con U=rYZ/s y V=Z, obtenemos la densidad conjunta de (Y,Z):
( r / s )( r 2 ) / 2 y ( r 2 ) / 2 z 2 +( r + s ) / 2 e ryz / 2 s e z / 2
g( y , z ) = ( rz / s ) y > 0 , z > 0
2 ( r + s ) / 2 ( r / 2 ) ( s / 2 )
12
Para construir un intervalo de confianza para el cuociente Q= , usamos entonces el estadstico
22
n 2 1 n1 12 22
( )( )( ) ~ Fn1 1 , n 2 1 .
n1 1 n 2 22 12
Ejercicio:
1
Muestre que si Y ~ Fr ,s entonces ~ Fs ,r .
Y
rY / s
Muestre que ~ Beta(( r 2 ) / 2 ,( s 2 ) / 2 ) .
1 + rY / s
46
4. ESTIMACIN POR INTERVALO
Y
Sea = el estimador de Mxima Verosimilitud de , se tiene:
n
n ( )
P( u ) = 1
(1 )
Lo que equivale a: P( n( ) 2 u 2 ( 1 ) 0 ) = 1 .
( 1 ) ( 1 )
[ u , + u ]
n n
4.4 EJERCICIOS
1. Sea una m.a.s. X 1 , X 2 ,..., X n de una distribucin normal de media desconocida y varianza 2
conocida.
a) D el nmero mnimo n del tamao de la muestra para que un intervalo de confianza I a 95% tenga un
largo L a lo ms igual a 0.016 .
b) Sea L = / 5 . D el nivel de confianza 1 cuando n=10, 20, 30 y 100.
c) Repetir b) con 2 desconocido. Comente.
d) D el intervalo de confianza de largo mnimo para con un nivel de confianza de 95%, cuando 2 = 4 .
2. Una empresa desea estimar el promedio de tiempo que necesita una secretaria para llegar a su trabajo. Se
toma una m.a.s. de 36 secretarias y se encuentra un promedio muestral de 40 minutos. Suponiendo que el
tiempo de trayecto proviene de una N ( , 2 ) , con 2 = 12 , d un intervalo de confianza para la media .
3. Se dispone de 10 muestras de sangre tomadas en las mismas condiciones a una misma persona. Se
obtiene para cada una la dosis de Colesterol (en gramos) 245, 248, 250, 247, 249, 247, 247, 246, 246, 248.
Cada medida puede considerarse como una realizacin particular de la variable X "tasa de Colesterol". Se
supondr que X ~ N ( , 2 ) .
47
N. LACOURLY
4. En el ejercicio 6 del capitulo 3, muestre que para construir un intervalo de confianza al 95% para , en el
caso no bayesiano, hay que resolver una desigualdad de segundo grado en y escriba la desigualdad.
6. Se tienen 2 muestras de tamaos n1 y n 2 respectivamente de una misma v.a. X medida sobre dos
poblaciones distintas. Se asume que para ambas poblaciones X sigue una distribucin Normal: N ( 1 , 12 ) y
N ( 2 , 22 ) respectivamente.
7. Se considera una v.a. X ~ N ( ,1 ) y una m.a.s. de X con una sola observacin x. Dada una constante
a>0, se define el intervalo aleatorio: C a ( x ) = [ Min( 0 , x a ), Max( 0 , x + a )] .
a) Muestre que P( C a ( x ) | = 0 ) = 1 x .
b) Muestre que C a ( x ) | es un intervalo de confianza para de nivel de confianza 1 = 95%, cuando
a=1.65.
c) Sea ( ) ( ) una distribucin a priori para . Deducir la distribucin a posteriori de dado x.
d) Sea la funcin de distribucin de la normal N(0,1). Muestre que se encuentra una probabilidad
( x ) ( a ) si x -a
condicional P( C a ( x ) | x ) = ( a ) ( a ) si - a x a
( a ) ( x ) si x > a
48