Está en la página 1de 14

Probabilidades y Estadstica (Computacin)

Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires


Ana M. Bianco y Elena J. Martnez 2004
177
Inferencia estadstica Intervalos de confianza
Cuando se obtiene una estimacin puntual de un parmetro, es conveniente acompaar
dicha estimacin por una medida de la precisin de la estimacin. Un modo de hacerlo
es informar el estimador y su error standard. Otro modo es reemplazar la estimacin
puntual por un intervalo de valores posibles para el parmetro.
Ejemplo: Supongamos que tenemos una m.a.
n
X X X ,..., ,
2 1
de una distribucin
) , (
2
o
N con varianza
2
o
conocida. Por ser los datos normales, sabemos que
) 1 , 0 ( ~ , ~
2
N
n
X
n
N X
o
o

|
|
.
|

\
|
y, por lo tanto, sabemos que la probabilidad de que
o
X
n


se encuentre entre 1.96 y
1.96 es 0.95, es decir
95 . 0 96 . 1 96 . 1 =
|
|
.
|

\
|


o
X
n P


Probabilidades y Estadstica (Computacin)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martnez 2004
178
A partir de esta expresin obtenemos
95 . 0 96 . 1 96 . 1 95 . 0 96 . 1 96 . 1 =
|
|
.
|

\
|
+ =
|
|
.
|

\
|

n
X
n
X P
n
X
n
P
o o o o

Es decir, que la probabilidad de que el intervalo


(

+
n
X
n
X
o o

96 . 1 , 96 . 1
contenga al verdadero valor del parmetro es 0.95. Este intervalo se denomina intervalo de
confianza para de nivel de confianza 0.95.
Definicin: Sea
n
X X X ,..., ,
2 1
una m.a. de una distribucin que depende de un parmetro .
Dadas dos funciones de la muestra ) ,...., , (
2 1 n
X X X a y ) ,...., , (
2 1 n
X X X b tales que
( ) = 1 ) ,..., , ( ) ,..., , (
2 1 2 1 n n
X X X b X X X a P
con pequeo (por ejemplo, 0.10, 0.05, 0.01), el intervalo | | ) ,..., , ( ), ,..., , (
2 1 2 1 n n
X X X b X X X a se
denomina intervalo de confianza de nivel 1 - para el parmetro .
Interpretacin: Supongamos que, en base a diferentes muestras calculamos los correspondientes
intervalos de confianza para . Entonces el (1 - ) 100% de ellos contendrn al verdadero valor .
Probabilidades y Estadstica (Computacin)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martnez 2004
179
Observaciones: 1) No es correcto decir la probabilidad de que pertenezca al intervalo (a,b)
es 1 - porque no es una variable aleatoria. El intervalo es aleatorio ya que sus extremos son
funciones de la muestra y por lo tanto, debemos decir la probabilidad de que el intervalo (a,b)
contenga al parmetro es 1 -
2) Una vez construdo el intervalo a partir de una muestra dada, ya no tiene sentido hablar de
probabilidad. En todo caso, tenemos confianza de que el intervalo contenga a . La confianza
est puesta en el mtodo de construccin de los intervalos, que nos asegura que (1 - ) 100% de
las muestras producirn intervalos que contienen a .
Intervalos de confianza para los parmetros de una distribucin normal
Distribucin t: Sean dos v.a. Z ~N(0,1) y U ~ |
.
|

\
|
=
2
1
,
2
2
n
n
independientes, entonces

n
t
n
U
Z
T ~ =
Se dice que T tiene distribucin t de Student con n grados de libertad. Esta distribucin
est tabulada para diferentes valores de n. Su densidad es simtrica respecto al 0 y tiene
forma de campana, pero tiene colas ms pesadas que la distribucin normal standard.
Cuando n tiende a infinito, la distribucin de Student tiende a la distribucin normal
standard.
Proposicin: Sea
n
X X X ,..., ,
2 1
una m.a. de una distribucin N(,
2
), entonces
a) ) 1 , 0 ( ~ , ~
2
N
X
n
n
N X

|
|
.
|

\
|
b)
1
) (
~
) 1 (
1
2
2 2
1
2
2

n
X X
S
S n
n
i
i
n
con

c)
2
S X y son independientes
d)
1
~

n
t
S
X
n

Dem: a) Ya hemos visto que cualquier combinacin de v.a. normales independientes es
normal y el promedio es una combinacin lineal particular.
Probabilidades y Estadstica (Computacin)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martnez 2004
180
b) y c) Estn fuera del alcance de este curso.
e) Resulta de a) b) y c) pues
~
) 1 (
) 1 , 0 ( ~
2
1
2
2


n
S n
N
X
n


y
son v.a. independientes. Entonces, por definicin de la distribucin t de Student,

1
2
2
~
) 1 (
) 1 (

n
t
S
X
n
n
S n
X
n



Intervalo de confianza para la media de la distribucin normal con varianza
conocida: Sea
n
X X X ,..., ,
2 1
una m.a. de una distribucin N(,
2
o
), con varianza
2
o

conocida, entonces
) 1 , 0 ( ~ N
X
n
o



=
|
|
.
|

\
|

1
2 / 2 /
z
X
n z P
o
de donde se deduce el siguiente intervalo de confianza de nivel 1 - para ,

(

+
n
z X
n
z X
o o

2 / 2 /
, (1)
Intervalo de confianza para la media de la distribucin normal con varianza
desconocida: Sea
n
X X X ,..., ,
2 1
una m.a. de una distribucin N(,
2
), entonces

1
~

n
t
S
X
n

Probabilidades y Estadstica (Computacin)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martnez 2004
181


=
|
|
.
|

\
|



1
2 / , 1 2 / , 1 n n
t
S
X
n t P
de donde se deduce el siguiente intervalo de confianza de nivel 1 - para ,

(

+

n
S
t X
n
S
t X
n n 2 / , 1 2 / , 1
,

Intervalo de confianza para la varianza de la distribucin normal con media
conocida: Sea
n
X X X ,..., ,
2 1
una m.a. de una distribucin N(
o
,
2
), con media
o
conocida, entonces
1
2
1
,
2
1
~ 1 ) 1 , 0 ( ~
2
1
2
n i
X
n i N
X
o i o i
|
.
|

\
|
= |
.
|

\
|


Como adems las v.a. son independientes

=
|
.
|

\
|
= |
.
|

\
|
n
i
n
o i
n X
1
2
2
2
1
,
2
~


Cmo elegimos los percentiles de la distribucin
2
que encierran un rea igual a 1 - ?

2
2 / 1 ,

n

2
2 / ,

n
Probabilidades y Estadstica (Computacin)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martnez 2004
182
Los elegimos de manera tal que quede un rea igual a /2 en cada extremo. Entonces,
( )


=
|
|
|
|
.
|

\
|

1
2
2 / ,
2
1
2
2
2 / 1 , n
n
i
o i
n
X
P
Se obtiene el siguiente intervalo
( ) ( )
(
(
(
(

= =

2
2 / 1 ,
1
2
2
2 / ,
1
2
,

n
n
i
o i
n
n
i
o i
X X
Intervalo de confianza para la varianza de la distribucin normal con media
desconocida: Sea
n
X X X ,..., ,
2 1
una m.a. de una distribucin N(,
2
), entonces
2
1
2
2
~
) 1 (

n
S n

Por lo tanto,


=
|
|
.
|

\
|


1
) 1 (
2
2 / , 1
2
2
2
2 / 1 , 1 n n
S n
P
Se obtiene el siguiente intervalo
(
(



2
2 / 1 , 1
2
2
2 / , 1
2
) 1 (
,
) 1 (


n n
S n S n
Ejemplos: Sea
49 2 1
,..., , X X X una m.a., ) , ( ~
2
N X
i
.
a) Supongamos que el verdadero valor del desvo standard es
o
= 35 y que se observa
160 = x y construyamos un intervalo de confianza para la media de nivel 0.95.
Como las v.a. son normales y la varianza es conocida, el intervalo para ser de la forma
Probabilidades y Estadstica (Computacin)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martnez 2004
183

|
|
.
|

\
|
+
n
z X
n
z X
o o

2 / 2 /
,
con 96 . 1
025 . 0 2 /
= = z z

, 49 , 35 = = n
o
y valor observado de X igual a 160. Obtenemos
( ) ( ) 8 . 169 , 2 . 150 8 . 9 160 , 8 . 9 160
49
35
96 . 1 160 ,
49
35
96 . 1 160 = + =
|
|
.
|

\
|
+
b) Supongamos ahora que la varianza es desconocida pero que el valor observado de S
es s=35. El correspondiente intervalo de confianza para ser de la forma

|
|
.
|

\
|
+

n
S
t X
n
S
t X
n n 2 / , 1 2 / , 1
,

con 01 . 2
025 . 0 , 48 2 / , 1
= =

t t
n
. Obtenemos
( ) ( ) 170.05 , 95 . 149 05 . 10 160 , 05 . 10 160
49
35
01 . 2 160 ,
49
35
01 . 2 160 = + =
|
|
.
|

\
|
+
Notemos que es ms ancho que el anterior
c) Suponiendo como antes que observamos 160 = x y 35 = s , hallemos un intervalo de
confianza para
2
de nivel 0.95.
Por tratarse de una muestra normal con media desconocida, el intervalo para
2
ser de
la forma

|
|
.
|

\
|


2
2 / 1 , 1
2
2
2 / , 1
2
) 1 (
,
) 1 (


n n
S n S n
con 02 . 69
2
025 . 0 , 48
2
2 / , 1
= =


n
y 75 . 30
975 . 0 , 48 2 / 1 , 1
= =


n
. Obtenemos
( ) 20 . 1912 , 93 . 851
75 . 30
35 48
,
02 . 69
35 48
2 2
=
|
|
.
|

\
|
y un intervalo de confianza para de nivel 0.95 ser
( ) ( ) 43.73 , 19 . 29 20 . 1912 , 93 . 851
75 . 30
35 48
,
02 . 69
35 48
2 2
= =
|
|
.
|

\
|

Probabilidades y Estadstica (Computacin)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martnez 2004
184
Esto ltimo resulta de aplicar una funcin montona creciente a cada extremo del
intervalo para
2
Determinacin del tamao de muestra: Consideremos el intervalo de confianza para con
varianza conocida en el caso de una m.a. normal. La longitud del intervalo obtenido (1) es

n
z L
o

2 /
2 =
y depende de
nivel de confianza ()
varianza o desvo standard de las observaciones (
o
)
tamao de la muestra (n)
Un modo de obtener mayor precisin, es decir un intervalo ms angosto, es aumentando
el tamao de la muestra. Si se desea una longitud menor o igual que L
o
, entonces

2
2 / 2 /
2 /
2 2
2
|
|
.
|

\
|
=
o
o
o
o
o
o
L
z
n
L
z
n L
n
z L


Ejemplo: Supongamos que
o
= 35, qu tamao de muestra se requiere como mnimo
para obtener un intervalo de nivel 0.95 de longitud menor o igual que 10?.
Por lo tanto, 35 , 10
o
= =
o
L y 96 . 1
025 . 0
= z , entonces
189 23 . 188
10
35 96 . 1 2
2
=
|
.
|

\
|
n n
En el caso de varianza desconocida el problema es ms complejo porque el percentil t
tambin depende del tamao de muestra.
Mtodo general para obtener intervalos de confianza:
Sea
n
X X X ,..., ,
2 1
una m.a. de una distribucin que depende de un parmetro .
Supongamos que existe una funcin ) , ,..., , (
2 1

n
X X X T (es decir, una funcin de la
muestra y del parmetro) cuya distribucin no depende de ni de ningn otro parmetro
desconocido. Entonces, existen dos valores a y b tales que
( ) = 1 ) , ,..., , (
2 1
b X X X T a P
n
y, a partir de esta expresin, es posible obtener un intervalo de confianza para .
Probabilidades y Estadstica (Computacin)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martnez 2004
185
La funcin ) , ,..., , (
2 1

n
X X X T se denomina pivote.
Ejemplo: Sea
n
X X X ,..., ,
2 1
una m.a. de una distribucin exponencial de parmetro .
Hemos demostrado que

=

n
i
i
n X
1
) , ( ~
Usando este resultado y que, si 0 ) , ( ~ > a V y entonces |
.
|

\
|

a
aV

, ~ , se puede
demostrar que

=
|
.
|

\
|
=
n
i
n i
n
X
1
2
2
2
1
,
2
2
~ 2
Usando como pivote la funcin

=
=
n
i
i n
X X X X T
1
2 1
2 ) , ,..., , ( , podemos obtener un
intervalo de confianza de nivel 1 - para el parmetro .


= |
.
|

\
|


=

1 2
1
2
2 / , 2
2
2 / 1 , 2
n
i
n i n
X P


=
|
|
|
|
.
|

\
|


= =

1
2 2
1
2 / , 2
1
2 / 1 , 2
n
i
i
n
n
i
i
n
X X
P
y el intervalo requerido es
(
(
(
(


= =

n
i
i
n
n
i
i
n
X X
1
2 / , 2
1
2 / 1 , 2
2
,
2


Ejemplo: Sea
n
X X X ,..., ,
2 1
una m.a. de una distribucin U(0,). Para obtener un intervalo
de confianza para , recordemos que el EMV de es ) ,..., ( max

1 n
X X = y probemos
que la distribucin de /

no depende de .
Llamemos V a la v.a. ) ,..., ( max
1 n
X X . Recordemos que, si
n
X X X ,..., ,
2 1
es una m.a. de
una distribucin F
X
, entonces la funcin de distribucin de V est dada por
Probabilidades y Estadstica (Computacin)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martnez 2004
186
( )
n
X V
v F v F ) ( ) ( =
Queremos demostrar que la distribucin de V/. no depende de .

( )
n
X V V
w F w F w V P w
V
P w F
i
) ( ) ( ) ( ) (
/

= = =
|
.
|

\
|
=
Como, en nuestro caso,
i
X ~U(0,),
( )

< <

=

< < |
.
|

\
|

= =
1 w si 1
1 w 0 si
0 w si 0

1
w 0
0 0
) ( ) (
/
n
n
n
X V
w
w
w
w
w F w F
i

si
si
si
Por lo tanto, la distribucin de V/ no depende de . Derivando, se obtiene la densidad de
V/
) ( ) (
) 1 , 0 (
1
/
w I w n w f
n
V

=


Utilizando

) ,..., ( max
) , ,..., , (
1
2 1
n
n
X X
X X X T = como pivote, obtendremos un intervalo
de confianza para de nivel 1 - . Buscamos a y b tales que

= |
.
|

\
|
1
) ,..., ( max
1
b
X X
a P
n
y, obtenemos el siguiente intervalo

(

a
X X
b
X X
n n
) ,..., ( max
,
) ,..., ( max
1 1
Cmo elegimos a y b?. Observando (2), debemos hallar a y b , 0 < a < b < 1, tales que

= = =

b
a
n n
b
a
n n
a b w dw w n 1
1
(2)
Obviamente hay infinitas soluciones de esta ecuacin, pero podramos elegir la solucin
que produce el intervalo de menor longitud esperada, es decir, buscar a y b que
minimicen E(L) sujeto a la condicin (2), siendo
Probabilidades y Estadstica (Computacin)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martnez 2004
187
|
.
|

\
|
=
b a
X X L
n
1 1
) ,..., ( max
1
Como ya hemos demostrado que
1
) ,..., ( max (
1
+
=
n
n
X X E
n
, debemos minimizar
|
.
|

\
|

+ a b n
n 1 1
1
(3)
sujeto a la condicin = 1
n n
a b .
Esto puede hacerse utilizando multiplicadores de Lagrange o bien, despejando de esta
ltima expresin a en funcin de b, reemplazndola en (3) y minimizando la expresin
resultante respecto de a.
El intervalo de mnima longitud esperada es

|
|
.
|

\
|
n
n n
X X X X

) ,..., ( max
,
1
) ,..., ( max
1 1
Intervalos de confianza de nivel asinttico 1 - :
En muchos problemas no es posible encontrar intervalos de confianza de nivel exacto
1 - , o bien son de muy difcil construccin. En otro casos disponemos de muy poca
informacin sobre la distribucin de las variables aleatorias. En estos dos tipos de
situaciones es posible obtener intervalos de confianza de nivel aproximado cuando
tenemos un tamao de muestra grande.
Definicin: Sea
n
X X X ,..., ,
2 1
una m.a. de una distribucin que depende de un parmetro
. Dadas dos sucesiones { } ) ,...., , (
2 1 n n
X X X a y { } ) ,...., , (
2 1 n n
X X X b tales que
( ) =

1 ) ,..., , ( ) ,..., , ( lim
2 1 2 1 n n n n
n
X X X b X X X a P
la sucesin de intervalos | | ) ,..., , ( ), ,..., , (
2 1 2 1 n n n n
X X X b X X X a es una sucesin de
intervalos de confianza de nivel asinttico 1 - para el parmetro . Tambin se dice
que, si n es suficientemente grande, el intervalo | | ) ,..., , ( ), ,..., , (
2 1 2 1 n n n n
X X X b X X X a
tiene nivel aproximado 1 - .
Porqu calcular intervalos de nivel asinttico?
Porque no es posible encontrar una funcin pivote que no dependa del parmetro
Porque no se conoce a distribucin exacta de la funcin pivote
Porque en general es ms fcil encontrar la distribucin asinttica que la exacta de la
funcin pivote
Probabilidades y Estadstica (Computacin)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martnez 2004
188
Ejemplos: 1) Sea
n
X X X ,..., ,
2 1
una m.a. de una distribucin F con E(X
i
) = y
V(X
i
) =
2
< . Buscamos un intervalo de confianza para .
Sabemos que X es un estimador insesgado y consistente de . No conocemos su
distribucin exacta porque no conocemos la de X
i
, pero sabemos que
) 1 , 0 ( N
X
n
d


Si
2
es conocido, esta funcin podra servir de pivote para el intervalo de nivel
aproximado, pero qu usamos si
2
es desconocido.
Propiedad:
aY Y U
a U
Y Y
d
n n
p
n
d
n

)
`




Como
p
s por ser un estimador consistente, entonces 1
p
s

y 1
p
s

.
Luego,
) 1 , 0 (
1
s
) 1 , 0 (
N
s
X
n
N
X
n
d
p
d



A partir de este resultado,



|
|
.
|

\
|

1
2 / 2 /
z
s
X
n z P
y se obtiene el siguiente intervalo de nivel aproximado 1 -

(

+
n
s
z X
n
s
z X
2 / 2 /
,

Probabilidades y Estadstica (Computacin)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martnez 2004
189
Intervalo de confianza de nivel asinttico 1 - para el parmetro p de la
distribucin Binomial:
Sea
n
X X X ,..., ,
2 1
una m.a. de una distribucin Bi(1,p) . Entonces

=
=
n
i
i
p n Bi X X
1
) , ( ~ . Queremos construir un intervalo de nivel asinttico 1 - para p.
Recordemos que, por el TCL,
|
.
|

\
|
= =

=
n
p p
p N
n
X
n
X
p
a
n
i
i
) 1 (
, ~
) (
1
y, por lo tanto



|
|
|
|
|
.
|

\
|

1
) 1 (
2 / 2 /
z
n
p p
p
n
X
z P (4)
Hay dos formas de obtener un intervalo para p a partir de esta ltima expresin.
a) Como p
n
X
n
X
p
n
i
i
=

=1
por la Ley de los Grandes Nmeros, podemos aplicar la
Propiedad enunciada antes y reemplazar en el denominador del pivote p por su
estimador. Entonces



|
|
|
|
|
.
|

\
|

1
) 1 (
2 / 2 /
z
n
p p
p
n
X
z P



|
|
|
|
|
.
|

\
|
|
.
|

\
|

+
|
.
|

\
|

1
1 1
2 / 2 /
n
n
X
n
X
z
n
X
p
n
n
X
n
X
z
n
X
P
Probabilidades y Estadstica (Computacin)
Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Ana M. Bianco y Elena J. Martnez 2004
190
obteniendo un intervalo para p de nivel aproximado 1 .
b) Reescribimos la expresin (4) en la forma



|
|
|
|
|
.
|

\
|

|
.
|

\
|


|
|
|
|
|
.
|

\
|

1
) 1 (
1
) 1 (
2
2 /
2
2 /
z
n
p p
p
n
X
P z
n
p p
p
n
X
P
Observemos que

n
p p
z p
n
X
z
n
p p
p
n
X
) 1 (

) 1 (
2
2 /
2
2
2 /
2

|
.
|

\
|

|
.
|

\
|


0
) 1 (
2
2
2 /
2
2

+ |
.
|

\
|

n
p p
z p
n
X
p
n
X

0
2
1
2
2
2 /
2
2 / 2
|
.
|

\
|
+
|
|
.
|

\
|
+
|
|
.
|

\
|
+
n
X
n
z
n
X
p
n
z
p

Buscamos las races de esta ecuacin de segundo grado, que llamaremos
1
p y
2
p y el
intervalo pedido ser
( )
2 1
, p p

También podría gustarte