Documentos de Académico
Documentos de Profesional
Documentos de Cultura
9- Intervalos de confianza
9.1 Introduccin
Se ha visto como construir a partir de una muestra aleatoria un estimador puntual de un parmetro
desconocido. En esos casos necesitbamos dar algunas caractersticas del estimador, como por
ejemplo si era insesgado o su varianza.
A veces resulta ms conveniente dar un intervalo de valores posibles del parmetro desconocido,
de manera tal que dicho intervalo contenga al verdadero parmetro con determinada probabilidad.
,
donde los
Especficamente, a partir de una muestra aleatoria se construye un intervalo
1
2
( (
))
desconocido a estimar y es un valor real entre cero y uno dado de antemano. Por ejemplo si
,
tal que P
,
= 0.95 , o escrito de otra
= 0.05 , se quiere construir un intervalo
1
2
1
2
forma P = 0.95
( (
))
y
son estadsticos, los valores que
Esta probabilidad tiene el siguiente significado: como
1
2
ellos toman varan con los valores de la muestra, es decir si x1 , x 2 ,..., x n son los valores medidos de
tomar el valor y el estadstico
tomar el valor . Si
la muestra entonces el estadstico
1
,
1
significa que si medimos la muestra 100 veces obtendremos 100 valores diferentes para
1
2
y por lo tanto obtendremos 100 intervalos distintos, de los cuales aproximadamente 5 de ellos no
contendrn al verdadero parmetro.
Al valor 1 se lo llama nivel de confianza del intervalo. Tambin se suele definir como nivel de
confianza al (1 )100%
La construccin repetida de un intervalo de confianza para se ilustra en la siguiente figura
153
9.2 Intervalo de confianza para la media de una distribucin normal, varianza conocida.
El mtodo general para construir intervalos de confianza es el siguiente llamado mtodo del pivote:
Supongamos el siguiente caso particular, sea ( X 1 , X 2 ,..., X n ) una muestra aleatoria de tamao n de
una v.a. X donde X ~ N ( , 2 ) , 2 conocido, se quiere construir un intervalo de confianza para
de nivel 1 . Supongamos = 0.05 .
1- tomamos un estimador puntual de , sabemos que = X es un estimador con buenas propiedades.
X
2- a partir de = X construimos el estadstico Z =
. Notar que Z (pivote) contiene al ver-
n
dadero parmetro y que bajo las condiciones dadas Z ~ N (0,1)
3- como conocemos la distribucin de Z, podemos plantear: hallar un nmero z tal que
P( z Z z ) = 0.95
Por la simetra de la distribucin normal estndar podemos escribir
P( z Z z ) = (z ) ( z ) = 2( z ) 1 = 0.95 ( z ) = 0.975 z = 1.96
X
Por lo tanto P( 1.96 Z 1.96 ) = P 1.96
1.96 = 0.95
Despejamos :
P 1.96
= P 1.96
1.96 = P 1.96
X 1.96
=
n
n
X 1.96
X = P X 1.96
X + 1.96
= 0.95
n
n
n
n
Entonces
P X 1.96
X + 1.96
= P X 1.96
; X + 1.96
= 0.95
n
n
n
n
Es decir el intervalo de confianza para es X 1.96
; X + 1.96
y tiene nivel de confiann
n
za 0.95 o 95%.
= X 1.96 y
= X + 1.96
Aqu
1
2
n
n
Repetimos el procedimiento anterior y construimos un intervalo de confianza para con nivel de
confianza 1
154
1 n
X i para una muestra aleatoria ( X 1 , X 2 ,..., X n ) de
n 1=1
tamao n. Sabemos que es un estimador insesgado y consistente de .
2-Construimos el estadstico
X
Z=
~ N (0,1)
/ n
P( z Z z ) = 1- ,
donde la incgnita es el nmero real z.
Si reemplazamos la v.a. Z por su expresin tenemos:
P z
z = P z
X z
X + z
= P X z
= 1-
/ n
n
n
n
n
Multiplicando todos los miembros de la desigualdad por -1 (el orden de los miembros se invierte)
llegamos a:
P X z
X +z
= 1-
n
n
Evidentemente, si definimos
1 = X z n
y
tales que P
= 1- ,
, hemos construido dos estadsticos
1
2
1
2
2 = X + z
n
,
. Todos los elemenes decir hemos construido el intervalo de confianza bilateral deseado
y
son conocidos ya que el nmero z verifica la ecuacin
tos que forman los estadsticos
1
2
anterior, es decir (ver figura):
z = z
155
(z ) = 1
o de otra forma P ( Z > z ) = .
2
2
Al valor de z que verifica esta ecuacin se lo suele indicar z . En consecuencia, el intervalo de
2
[ , ] = X z
1
En consecuencia:
, X + z
2
, X + z
X z
n
n
2
2
(8.1)
Ejemplo:
Un ingeniero civil analiza la resistencia a la compresin del concreto. La resistencia est distribuida aproximadamente de manera normal, con varianza 1000 (psi)2. Al tomar una muestra aleatoria
de 12 especmenes, se tiene que x = 3250 psi.
a) Construya un intervalo de confianza del 95% para la resistencia a la compresin promedio.
b) Construya un intervalo de confianza del 99% para la resistencia a la compresin promedio.
Compare el ancho de este intervalo de confianza con el ancho encontrado en el inciso a).
Solucin:
La v. a. de inters es Xi: resistencia a la compresin del concreto en un espcimen i
Tenemos una muestra de n = 12 especmenes.
Asumimos que X i ~ N ( , 2 ) para i = 1,2,3,...,12 con 2 = 1000
a) Queremos un intervalo de confianza para de nivel 95%. Por lo tanto = 0.05
El intervalo a utilizar es X z
, X + z
.
n
n
2
2
Reemplazando:
1000
1000
,3250 + 1.96
3250 1.96
= 3232.10773, 3267.89227
12
12
156
El intervalo a utilizar es X z
, X + z
.
n
n
2
2
Reemplazando:
1000
1000
,3250 + 2.58
3250 2.58
= 3226.44793, 3273.55207
12
12
Notar que:
a) si n y estn fijos, a medida que disminuye tenemos que z aumenta, por lo tanto L
2
aumenta.
b) si y estn fijos, entonces a medida que n aumenta tenemos que L disminuye.
Podemos plantearnos la siguiente pregunta relacionada con el ejemplo anterior: qu tamao n de
muestra se necesita para que el intervalo tenga nivel de confianza 95% y longitud la mitad de la
longitud del intervalo hallado en a)?
Solucin: el intervalo hallado en a) tiene longitud 35.78454, y queremos que el nuevo intervalo
tenga longitud 17.89227 aproximadamente. Planteamos:
1000
L = 2 z / 2
17.89227
2 1.96
17.89227
n
n
Despejando n :
2
1000
2 1.96
n
n 48
17.89227
O sea, hay que tomar por lo menos 84 especmenes para que el intervalo tenga la longitud pedida.
despejando n
2z
n 2
l
157
L
menor o igual a = z
, que se conoce como precisin del estimador
2
n
2
Ejemplo: Se estima que el tiempo de reaccin a un estmulo de cierto dispositivo electrnico est
distribuido normalmente con desviacin estndar de 0.05 segundos. Cul es el nmero de mediciones temporales que deber hacerse para que la confianza de que el error de la estimacin de la
esperanza no exceda de 0.01 sea del 95%?
Nos piden calcular n tal que
= z
< 0.01 con = 0.05 .
2
n
2
2
0.05
0.05
2
Entonces n z 0.975
= (1.96 5) = 96.04 .
0
.
01
Para muestras tomadas de una poblacin normal, o para muestras de tamao n 30 , de una
poblacin cualquiera, el intervalo de confianza dado anteriormente en (8.1), proporciona buenos
resultados.
En el caso de que la poblacin de la que se extrae la muestra no sea normal pero n 30 , el nivel de confianza del intervalo (8.1) es aproximadamente 1 .
Pero para muestras pequeas tomadas de poblaciones que no son normales no se puede garantizar que el nivel de confianza sea 1 si se utiliza (8.1).
Ejemplo:
Supongamos que X representa la duracin de una pieza de equipo y que se probaron 100 de esas
piezas dando una duracin promedio de 501.2 horas. Se sabe que la desviacin estndar poblacional es =4 horas. Se desea tener un intervalo del 95% de confianza para la esperanza poblacional
E(X ) = .
Solucin:
En este caso, si bien no conocemos cul es la distribucin de X tenemos que el tamao de la muestra es n = 100 > 30 (muestra grande) por lo tanto el intervalo buscado es
, X + z
X z
n
n
2
2
= 0.025
2
De la tabla de la normal estandarizada obtenemos z 0, 025 =1.96. Entonces reemplazando:
4
4
, X + 1.96
X 1.96
100
100
158
4
4
4
4
, x + 1.96
x 1.96
= 501.2 1.96 10 ,501.2 + 1.96 10 = 500.4, 502.0 .
100
n
Al establecer que 500.4 , 502.0 es un intervalo al 95% de confianza de estamos diciendo que
probabilidad de que la muestra aleatoria ( X 1 , X 2 ,..., X n ) tome valores tales que el intervalo aleato
4
4
rio X 1.96
, X + 1.96
defina un intervalo numrico que contenga al parmetro fijo
100
100
desconocido es 0.95.
9.3 - Intervalo de confianza para la media de una distribucin normal, varianza desconocida
Nuevamente como se trata de encontrar un intervalo de confianza para nos basamos en la espe1 n
ranza muestral X = X i que sabemos es un buen estimador de . Pero ahora no podemos
n 1=1
usar como pivote a
X
Z=
/ n
porque desconocemos y una condicin para ser pivote es que, excepto por el parmetro a estimar ( en este caso ), todos los parmetros que aparecen en l deben ser conocidos. Entonces proponemos como pivote una variable aleatoria definida en forma parecida a Z pero reemplazando
por un estimador adecuado.
Ya vimos que la varianza muestral definida
2
1 n
S =
(X i X ) ,
n 1 1=1
donde X es la esperanza muestral, es un estimador insesgado de la varianza poblacional V ( X ) , es
decir, E S 2 = V ( X ) = 2 n . Entonces estimamos con S y proponemos como pivote a la variable aleatoria
2
( )
T =
X
S/ n
159
(k + 1)
2
f ( x) =
k
k x 2
2
k
1
+ 1
k +1
2
< x <
Notacin: T ~ t k
La grfica de la f.d.p. de la distribucin Student tiene forma de campana como la normal, pero
tiende a cero ms lentamente. Se puede probar que cuando k la fdp de la Student tiende a la
fdp de la N (0, 1) .
En la figura siguiente se grafica f(x) para diferentes valores de k
k =1
0.4
k =6
0.3
----- k =
0.2
0.1
-3
-2
-1
Anotaremos t ,k al cuantil de la Student con k grados de libertad que deja bajo la fdp a derecha un
rea de , y a su izquierda un rea de 1 .
Luego, para construir el intervalo de confianza buscado a partir del pivote T procedemos como en
los casos anteriores:
Comenzamos por plantear la ecuacin
P ( t T t ) = 1- ,
donde la incgnita es el nmero real t.
X
S
S
S
S
P t
t = P t
X t
X + t
= P X t
= 1-
S/ n
n
n
n
n
Multiplicando todos los miembros de la desigualdad por -1 (el orden de los miembros se invierte)
llegamos a:
160
S
S
P X t
X +t
= 1-
n
n
Evidentemente, si definimos
S
1 = X t n
y
tales que P
= 1- ,
, hemos construido dos estadsticos
1
2
1
2
= X +t S
n
veamos quien es el nmero t que verifica la ecuacin, es decir (ver figura):
k = 4 grados de libertad
.
2
Al valor de t que verifica esta ecuacin se lo suele indicar t
F (t ) = 1
, n 1
. En consecuencia, el intervalo de
S
S
, X + t
X t ,n 1
, n 1
n
n
2
2
En consecuencia:
con F t = 1 .
, n 1
2
2
S
S
, X + t
X t
n
n
2
2
(8.2)
161
Ejemplo:
Se hicieron 10 mediciones sobre la resistencia de cierto tipo de alambre que dieron valores
x1 , x2 ,..., x10 tales que x =
1 10
1 10
ohms
y
S
=
(xi x )2 = 1.36 ohms. Supngase
x
=
10
.
48
i
9
10 i =1
i =!
que X~N(,2).
Se desea obtener un intervalo de confianza para la esperanza poblacional al 90 %.
Tenemos que 1 = 0.90 = 0.1 / 2 = 0.05
De la Tabla de la t de Student tenemos que t 0.05,9 = 1.8331 . Entonces el intervalo de confianza
buscado es:
S
S
1.36
1.36
, X + t
= 10.48 1.8331
,10.48 + 1.8331
X t , n1
, n 1
n
n
10
10
2
2
X
S/ n
N (0 ,1)
aproximadamente
S
S
, X + z
X z
, pero su nivel es aproximadamente 1
n
n
2
2
2
X
~
N
2
2
2
(
(
)
)
Sean adems
X 11 , X 12 ,..., X 1n1 una muestra aleatoria de tamao n1 de X 1
(
(X
21
)
) una muestra aleatoria de tamao n
, X 22 ,..., X 2 n2
de X 2 .
162
12
1 n1
X 1 = X 1i ~ N 1 ,
n1 i =1
n1
n2
22
X = 1
X
~
N
,
2i
2 n
2 n2
i =1
2
Consideremos ahora la diferencia Y = X 1 X 2 . Si X 1 y X 2 tienen distribucin normal y son independientes, su diferencia tambin es normal, con esperanza igual a la diferencia de las esperanzas y la varianza es la suma de las varianzas:
2 2
X 1 X 2 ~ N 1 2 , 1 + 2
n1
n2
Por lo tanto
Z=
X 1 X 2 ( 1 2 )
12
n1
22
n2
La v.a. Z cumple con toda las condiciones para servir de pivote y construiremos nuestro intervalo
en forma anloga a cmo hicimos en los casos anteriores:
Comenzamos por plantear la ecuacin
P( z Z z ) = 1- ,
donde la incgnita es el nmero real z.
Reemplazamos la v.a. Z por su expresin y tenemos sucesivamente (multiplicando por / n y
restando X ):
X X 2 (1 2 )
P z 1
12 22
n1 n 2
2 2
2 2
z = P z 1 + 2 X 1 X 2 ( 1 2 ) z 1 + 2 =
n1 n 2
n1 n 2
12 22
12 22
= P (X 1 X 2 ) z
+
( 1 2 ) ( X 1 X 2 ) + z
+
= 1
n1 n 2
n1 n 2
Multiplicando todos los miembros de la desigualdad por -1 (el orden de los miembros se invierte)
llegamos a:
2 2
2 2
P X 1 X 2 z 1 + 2 ( 1 2 ) X 1 X 2 + z 1 + 2 = 1
n1
n2
n1 n 2
Evidentemente, si definimos
163
2
2
= X X z 1 + 2
1
1
2
n1
n2
2
2
= X X z 1 + 2 ,
1
2
2
n1
n2
y
tales que P
( )
= 1- , es decir
habremos construido dos estadsticos
1
2
1
1
2
2
habremos construido el intervalo de confianza bilateral deseado A , A . Todos los elementos que
y
son conocidos ya que el nmero z verifica la ecuacin anterior,
forman los estadsticos
1
2
es decir:
P( z Z z ) = ( z ) ( z ) =1- donde (z ) es la Fda para la v.a. Z ~ N (0,1)
o bien, segn vimos:
que anotamos z
( z ) = 1
2
2
En consecuencia, el intervalo de confianza bilateral al nivel de significacin 1- queda:
12 22
+
,
X 1 X 2 z
n1
n2
X 1 X 2 + z
2
12
n1
22
n2
Por lo tanto
Si X 1 y X 2 son dos variables aleatorias independientes normalmente distribuidas:
r
12 22
12 22
+ , X1 X2 +z
+
X1 X2 z
n1 n2
n1 n2
2
2
(8.3)
Ejemplo:
Se utilizan dos mquinas para llenar botellas de plstico con detergente para mquinas lavaplatos.
Se sabe que las desviaciones estndar de volumen de llenado son 1 = 0.10 onzas de lquido y
2 = 0.15 onzas de lquido para las dos mquinas respectivamente. Se toman dos muestras aleatorias, n1 = 12 botellas de la mquina 1 y n 2 = 10 botellas de la mquina 2. Los volmenes promedio de llenado son x1 = 30.87 onzas de lquido y x 2 = 30.68 onzas de lquido.
Asumiendo que ambas muestras provienen de distribuciones normales
Construya un intervalo de confianza de nivel 90% para la diferencia entre las medias del volumen
de llenado.
Solucin:
Como 1 = 0.90 entonces = 0.10
164
0.10 2 0.15 2
0.10 2 0.15 2
El intervalo ser (30.87 30.68) 1.65
+
; (30.87 30.68) + 1.65
+
12
10
12
10
Si se conocen las desviaciones estndar y los tamaos de las muestras son iguales (es decir
n1 = n 2 = n ), entonces puede determinarse el tamao requerido de la muestra de manera tal que la
longitud del intervalo sea menor que l
L = 2z
2
1
n
2
n
2z
n 2
l
2
2
1 + 2
Si las muestras aleatorias se toma de una distribucin normal, donde 1 y 2 son desconocidos,
n1 30 y n 2 30 , entonces se puede probar que al reemplazar 1 por S1 y 2 por S2, el estadstico
X 1 X 2 ( 1 2 )
S12 S12
+
n1 n1
N (0,1) .
aproximadamente
X 1 X 2 z
2
S12 S12
+
,
n1 n1
X 1 X 2 + z
2
S12 S12
+
,
n1 n1
(8.4)
Ejemplo:
De una muestra de 150 lmparas del fabricante A se obtuvo una vida media de 1400 hs y una desviacin tpica de 120 hs. Mientras que de una muestra de 100 lmparas del fabricante B se obtuvo
una vida media de 1200 hs. y una desviacin tpica de 80 hs.
Halla los lmites de confianza del 95% para la diferencia las vidas medias de las poblaciones A y
B.
165
Solucin:
Sean las variables aleatorias:
X 1 : duracin en horas de una lmpara del fabricante A
X 2 : duracin en horas de una lmpara del fabricante B
No se dice cul es la distribucin de estas variables, pero como n1 = 150 y n 2 = 100
podemos usar el intervalo dado en (8.4)
Tenemos que x1 = 1400 , x 2 = 1200 , s1 = 120 y s 2 = 80 .
Adems 1 = 0.95 z = z 0.025 = 1.96
2
Entonces el intervalo es
120 2 80 2
120 2 80 2
+
; 1400 1200 1.96
+
1400 1200 1.96
= 175.2077; 224.7922
150 100
150 100
Observacin: como este intervalo no contiene al cero, podemos inferir que hay diferencia entre las
medias con probabilidad 0.95, es ms, podemos inferir que la media del tiempo de duracin de las
lmparas del fabricante A es mayor que la media del tiempo de duracin de las lmparas del fabricante B con probabilidad 0.95 .
X 1 ~ N (1 , 12 )
2
X 2 ~ N ( 2 , 2 )
Sean adems
X 11 , X 12 ,..., X 1n1 una muestra aleatoria de tamao n1 de X 1
(
(X
21
)
) una muestra aleatoria de tamao n
, X 22 ,..., X 2 n2
de X 2 .
T=
r
X 1 X 2 ( 1 2 )
= 1
P t
T t
, n1 + n2 2
2
2 ,n1 + n2 2
X 1 X 2 ( 1 2 )
P t
t
= 1
, n1 + n2 2
, n1 + n2 2
1
1
2
2
Sp
+
n
n
1
2
1
1
1
1
P X 1 X 2 t
Sp
+
1 2 t
Sp
+
= 1
, n1 + n2 2
, n1 + n2 2
n
n
n
n
1
2
1
2
2
2
Entonces
Si X 1 y X 2 son dos variables aleatorias independientes normalmente distribuidas:
X 1 ~ N 1 , 1 , X 2 ~ N 2 , 2
y suponemos que las varianzas 12 y 22 son desconocidas
e iguales, es decir 1 = 2 =
Un intervalo de confianza para la diferencia 1 2 de nivel 1 es
2
X 1 X 2 t / 2,n1+ n 2 2 S p
1
n1
1
n2
; X 1 X 2 + t / 2,n1+ n2 2 S p
1
n1
1
n2
(8.5)
Ejemplo:
Se piensa que la concentracin del ingrediente activo de un detergente lquido para ropa, es afectada por el tipo de catalizador utilizado en el proceso de fabricacin. Se sabe que la desviacin estndar de la concentracin activa es de 3 g/l, sin importar el tipo de catalizador utilizado. Se realizan 10 observaciones con cada catalizador, y se obtienen los datos siguientes:
Catalizador 1: 57.9, 66.2, 65.4, 65.4, 65.2, 62.6, 67.6, 63.7, 67.2, 71.0
Catalizador 2: 66.4, 71.7, 70.3, 69.3, 64.8, 69.6, 68.6, 69.4, 65.3, 68.8
a) Encuentre un intervalo de confianza del 95% para la diferencia entre las medias de las concentraciones activas para los dos catalizadores. Asumir que ambas muestras fueron extradas de poblaciones normales con varianzas iguales.
b) Existe alguna evidencia que indique que las concentraciones activas medias dependen del catalizador utilizado?
167
Solucin:
Sean las variables aleatorias
X 1 : concentracin del ingrediente activo con catalizador 1
X 2 : concentracin del ingrediente activo con catalizador 2
Asumimos que ambas variables tienen distribucin normal con varianzas iguales
Estamos e3n las condiciones para usar (8.5)
Tenemos que x1 = 65.22 , x 2 = 68.42 , s1 = 3.444 , s 2 = 2.224 , n1 = n2 = 10
Calculamos S p2 =
9 3.444 2 + 9 2.224 2
= 8.4036
10 + 10 2
, n1 + n 2 2
= t 0.025,18 = 2.060
Entonces el intervalo es
1
1
1
1
+ ;65.22 68.42 2.060 2.89890
+ =
65.22 68.42 2.060 2.89890
10 10
10 10
= [ 5.8706;0.52935]
b) Existe alguna evidencia que indique que las concentraciones activas medias dependen del catalizador utilizado, pues el 0 no pertenece al intervalo.
En muchas ocasiones no es razonable suponer que las varianzas son iguales. Si no podemos garantizar que las varianzas son iguales, para construir un intervalo de confianza de nivel 1 para
1 2 utilizamos es estadstico
T* =
X 1 X 2 ( 1 2 )
S12 S12
+
n1 n1
Se puede probar que T * tiene aproximadamente una distribucin Student con grados de libertad donde
(S
(S
1
1
2
1
n1 + S 22 n2
) (
2
n1
S2 n
+ 2 2
n1 1
n2 1
P t T * t
,
2
2 ,
= 1
Y despejando 1 2 el intervalo es
168
X1 X 2 t
,
S12 S 22
+
,
n1 n 2
X 1 X 2 + t
2
S12 S 22
+
n1 n 2
Entonces
X1 X 2 t
,
S12 S 22
+
,
n1 n2
Donde
(S
(S
X 1 X 2 + t
2
1
(8.6)
n1 + S 22 n2
) (
2
1
1
S12 S 22
+
n1 n 2
n1
S2 n
+ 2 2
n1 1
n2 1
Ejemplo:
Una muestra de 6 soldaduras de un tipo tena promedio de prueba final de resistencia de 83.2 ksi y
desviacin estndar de 5.2. Y una muestra de 10 soldaduras de otro tipo tena resistencia promedio
de 71.3 ksi y desviacin estndar de 3.1. supongamos que ambos conjuntos de soldaduras son
muestras aleatorias de poblaciones normales. Se desea encontrar un intervalo de confianza de 95%
para la diferencia entre las medias de las resistencias de los dos tipos de soldaduras.
Solucin:
Ambos tamaos muestrales son pequeos y las muestras provienen de poblaciones normales. No
podemos asumir igualdad de varianzas. Entonces aplicamos (8.6)
Tenemos que x1 = 83.2 , x 2 = 71.3 , s1 = 5.2 , s 2 = 3.1 , n1 = 6; n2 = 10
Como 1 = 0.95 entonces
= 0.025
2
5.2 2 3.12
+
2
6
10
S12 n1 + S 22 n 2
Adems =
=
= 7.18 7
2
2
2
2
5.2
3. 1
S11 n1
S 22 n 2
+
6 +
10
n1 1
n2 1
5
9
Entonces buscamos en la tabla de la Student t 0.025, 7 = 2.365
Por lo tanto el intervalo es
X1 X 2 t
,
) (
S12 S 22
+
,
n1 n2
( ) (
X 1 X 2 + t
2
S12 S 22
+
=
n1 n 2
5.2 2 3.12
5.2 2 3.12
169
V (D j ) = V (X 1 j X 2 j ) = V (X 1 j ) + V (X 2 j ) 2Cov (X 1 j , X 2 j ) = 12 + 22 2Cov( X 1 , X 2 )
Estimamos E (D j ) = 1 2 con D =
1 n
1 n
(X 1 j X 2 j ) = X 1 X 2
D
=
j n
n j =1
j =1
Asumimos que D j ~ N D , D
) con
1 n
(D j D )2
n 1 j =1
j = 1,2,..., n
Las variables aleatorias en pares diferentes son independientes, no lo son dentro de un mismo par.
Para construir el intervalo de confianza notar que
T=
D D
SD / n
t n 1
P( t T t ) = 1- , deducimos que t = t
2
, n 1
SD
SD
; D + t
D t ,n 1
, n 1
n
n
2
2
Entonces
de nivel 1 para D = 1 2 es
SD
SD
; D + t
D t ,n 1
, n 1
n
n
2
2
(8.7)
Ejemplo:
Consideramos el ejemplo planteado al comienzo. Deseamos un intervalo de nivel 0.90
Sean las variables aleatorias
X 1 j : tiempo en segundos que tarda el individuo j en estacionar automvil 1 con j = 1,2,..., n
sujeto
Automvil 1
Automvil 2
(observacin x1 j ) (observacin x 2 j )
diferencia
Dj
1
2
3
4
5
6
7
8
9
10
11
12
13
14
37.0
25.8
16.2
24.2
22.0
33.4
23.8
58.2
33.6
24.4
23.4
21.2
36.2
29.8
19.2
5.6
-0.6
-17.2
0.6
-5.0
7.0
26.0
5.8
1.2
-6.2
0.6
4.0
-24.0
17.8
20.2
16.8
41.4
21.4
38.4
16.8
32.2
27.8
23.2
29.6
20.6
32.2
53.8
, n 1
es
12.68
12.68
; 1.21 + 1.771
1.21 1.771
= 4.79; 7.21
14
14
171
1 n
(X i X )
n 1 1=1
(n 1)S 2
2
Este estadstico contiene al parmetro desconocido a estimar 2 y tiene una distribucin conocida,
se puede probar que X tiene una distribucin llamada ji-cuadrado con n-1 grados de libertad
Observacin: Si X es una v.a. continua se dice que tiene distribucin ji-cuadrado con k grados de
libertad si su f.d.p. es
f ( x) =
1
(k )1 x
x 2 e 2
k
2 2
2
k
x>0
Notacin: X~ k
La distribucin ji-cuadrdo es asimtrica. En la figura siguiente se grafica la densidad para diferentes valores de k
2
0.12
k =2
0.1
k = 15
0.08
k = 30
0.06
0.04
0.02
10
20
30
40
50
60
Anotaremos 2 ,k al cuantil de la ji-cuadrado con k grados de libertad que deja bajo la fdp a derecha un rea de , y a su izquierda un rea de 1 .
Propiedades:
1- Se puede probar que si X 1 , X 2 ,..., X n son variables aleatorias independientes con distribucin
N (0,1) entonces Z = X 1 + X 2 + ... + X n tiene distribucin ji-cuadrado con n grados de libertad.
2
172
2- Si X 1 , X 2 ,..., X n son variables aleatorias independientes tal que X i tiene distribucin jicuadrado con k i grados de libertad, entonces Z = X 1 + X 2 + ... + X n tiene distribucin ji-cuadrado
con k grados de libertad donde k = k1 + k 2 + ... + k n
3- Si X ~ k2 entonces para k grande
2 X ~ N 2k 1, 1 aproximadamente.
Para desarrollar el intervalo de confianza planteamos hallar dos nmeros a y b tales que
(n 1)S 2 b = 1
es decir
P a
P(a X b ) = 1
1 , n 1
2
y b = 2
2
, n 1
k =5
1 , n 1
2
2
2
, n 1
Por lo tanto
(n 1)S 2 2 = 1
P 2
, n 1
2
2
1 2 ,n 1
y despejando 2 se llega a
(n 1)S 2
(n 1)S 2
2
P
2
2
,n 1
1 , n 1
2
2
= 1
Entonces
173
(n 1)S 2
;
2
, n1
2
(n 1)S 2
2
1 , n 1
2
(8.8)
(n 1)S 2
(n 1)S 2 ;
2
, n 1
1 , n 1
2
Ejemplo:
Un fabricante de detergente lquido est interesado en la uniformidad de la mquina utilizada para
llenar las botellas. De manera especfica, es deseable que la desviacin estndar del proceso de
llenado sea menor que 0.15 onzas de lquido; de otro modo, existe un porcentaje mayor del deseable de botellas con un contenido menor de detergente. Supongamos que la distribucin del volumen de llenado es aproximadamente normal. Al tomar una muestra aleatoria de 20 botellas, se obtiene una varianza muestral S 2 = 0.0153 . Hallar un intervalo de confianza de nivel 0.95 para la
verdadera varianza del volumen de llenado.
Solucin:
La v.a. de inters es X: volumen de llenado de una botella
Se asume que X ~ N ( , 2 ) con desconocido.
Estamos en las condiciones para aplicar (8.8)
Tenemos que 1 = 0.95 = 0.05 2
1 , n 1
2
= 02.975,19 = 8.91 y 2
2
, n 1
= 02.025,19 = 32.85
Adems S = 0.0153
2
(n 1)S 2
;
2
, n1
1 , n 1
2
Y un intervalo para es
0.00884 ;
32.85
8.91
0.0326 )
Por lo tanto con un nivel de 0.95 los datos no apoyan la afirmacin que < 0.15
174
Supongamos que se tienen dos poblaciones normales e independientes con varianzas desconocidas
12 y 22 respectivamente. Se desea encontrar un intervalo de nivel 1 para el cociente de las
12
dos varianzas 2 .
2
Se toma una muestra aleatoria de tamao n1 de una de las poblaciones y una muestra de tamao
n 2 de la otra poblacin. Sean S12 y S 22 las dos varianzas muestrales.
Consideramos el estadstico
S 22
F=
S12
22
12
12
, pues
22
F=
S 22 12
S12 22
Se puede probar que F tiene una distribucin llamada Fisher con n 2 1 y n1 1 grados de libertad.
Observacin:
Sea X una variable aleatoria continua, se dice que tiene distribucin Fisher con u grados de libertad
en el numerador y v grados de libertad en el denominador si su fdp es de la forma
u
f ( x) =
u + v u 2 2 1
x
2 v
u v u
x + 1
2 2 v
u +v
2
0< x<
En particular si W e Y son variables aleatorias independientes ji-cuadrado con u y v grados de libertad respectivamente, entonces el cociente
W
F= u
Y
v
Tiene una distribucin Fisher con u grados de libertad en el numerador y v grados de libertad en el
denominador.
Notacin: F ~ Fu ,v
La grfica de una distribucin Fisher es similar a la de una ji-cuadrado, es asimtrica. Anotamos
f ,u ,v al cuantil que deja a su derecha un rea de bajo la curva de densidad.
u = 15; v = 20
175
f ,u ,v
f1 ,u ,v =
1
f ,v ,u
b = f
2
, n2 1, n1 1
u = 15; v = 20
1 , n2 1, n1 1
2
Entonces
f ,n2 1,n1 1
S2 2
= 1
P f
22 22 f
, n2 1, n1 1
2
1 2 ,n2 1,n1 1 S1 1
Despejando el cociente
12
queda :
22
S2
2 S2
= 1
P 12 f
12 12 f
1 , n2 1, n1 1
, n2 1, n1 1
S
S
2
2
2
2
2
Por lo tanto
176
12
es
22
S12
S12
2 f 1 ,n 1, n 1 ; 2 f ,n 1,n 1
2
1
S2 2 2 1
2
S2
(8.9)
Ejemplo:
Una compaa fabrica propulsores para uso en motores de turbina. Una de las operaciones consiste
en esmerilar el terminado de una superficie particular con una aleacin de titanio. Pueden emplearse dos procesos de esmerilado, y ambos pueden producir partes que tienen la misma rugosidad
superficial promedio. Interesara seleccionar el proceso que tenga la menor variabilidad en la rugosidad de la superficie. Para esto se toma una muestra de 12 partes del primer proceso, la cual tiene
una desviacin estndar muestral S1 = 5.1 micropulgadas, y una muestra aleatoria de 15 partes del
segundo proceso, la cual tiene una desviacin estndar muestral S 2 = 4.7 micropulgadas. Se desea
encontrar un intervalo de confianza de nivel 90% para el cociente de las dos varianzas.
Suponer que los dos procesos son independientes y que la rugosidad de la superficie est distribuida de manera normal.
Solucin:
Estamos en las condiciones para aplicar (8.9)
Buscamos en la tabla de la Fisher f
y f
2
, n2 1, n1 1
1 , n2 1, n1 1
2
= f 0.95,14,11 =
f 0.05,11,14
1
= 0.39
2.58
= f 0.05,14,11 = 2.74
Entonces el intervalo es
5.12
5.12
0
.
39
;
2.74 = [0.46; 3.23]
2
2
4.7
4.7
Como este intervalo incluye al 1, no podemos afirmar que las desviaciones estndar de los dos
procesos sean diferentes con una confianza de 90%.
177
p (1) = P( X i = 1) = p
p (x ) =
p(0 ) = P( X i = 0 ) = 1 p,
es decir, Xi es una v.a. que toma slo dos valores: 1 (si el individuo verifica A) con probabilidad p
y 0 (cuando no verifica A) con probabilidad 1-p. Esto es equivalente a decir que Xi tiene una distribucin binomial con parmetros 1 y p: Xi ~ B(1,p).
Supongamos que consideramos una muestra aleatoria ( X 1 , X 2 ..., X n ) de tamao n . Si formamos
el estadstico X = X 1 + X 2 + ... + X n , es evidente que esta v.a. mide el nmero de individuos de la
muestra de tamao n que verifican la propiedad A. Por lo tanto por su significado X es una v.a.
cuya distribucin es binomial con parmetros n y p: X~B(n,p). De acuerdo con esto, la variable
X
aleatoria P definida: P =
representa la proporcin de individuos de la muestra que verifican la
n
propiedad A.
Observemos que siendo Xi ~ B(1,p) es E ( X i ) = p . Y, dado que X~B(n,p), tambin es
()
1
X 1
E P = E = E ( X ) = np = p , es decir P es un estimador insesgado de p . Esto es de espen
n n
n
X 1
rar pues P =
= Xi .
n n i =1
Pero adems, es fcil ver que P es estimador consistente de p . En efecto, tenemos que E P = p ,
()
pero tambin es
p (1 p )
X 1
.
V P = V = 2 np (1 p ) =
n
n n
()
Deseamos construir un intervalo de confianza de p. Es razonable basarnos en el estimador insegado P . Consideramos como pivote a la variable aleatoria
Z=
P p
p(1 p )
n
efecto:
X
X
X
Siendo P = 1 + 2 + ... + n ,
n
n
n
n
n
X
X p (1 p )
es E P = E i = p y V P = V i =
n
n
n
i =1
i =1
()
()
Por lo tanto:
Z=
P p
p(1 p )
n
n grande
N (0,1) ,
El pivote puede ponerse en una forma ms conveniente si tenemos en cuenta que, segn vimos
recin, P es estimador consistente de p y en consecuencia, en el denominador reemplazamos el
parmetro desconocido p por su estimador P , y se puede probar que :
178
Z=
P p
N(0,1). aproximadamente si n es grande
P 1 P
n
Partiendo de este pivote podemos seguir los mismos pasos de los casos anteriores para llegar al
siguiente intervalo de confianza al nivel 1 de p:
P 1 P
P z
, P + z
n
2
2
Entonces
P 1 P
con z
2
= 1 .
P z
P 1 P
, P + z
n
2
P 1 P
(8.10)
Observaciones:
1- Este procedimiento depende de la aproximacin normal a la distribucin binomial. Por lo tanto
el intervalo (8.10) se puede utilizar si nP > 10 y n(1 P ) > 10 , es decir, la muestra debe contener
un mnimo de diez xitos y diez fracasos.
P 1 P
2- La longitud del intervalo es L = 2 z
, pero esta expresin est en funcin de P
n
2
Si nos interesa hallar un valor de n de manera tal que la longitud L sea menor que un valor determinado, podemos hacer dos cosas:
a) tomar una muestra preliminar, con ella estimar p con P y de la expresin anterior despejar n, lo
que lleva a
L = 2z
2
P 1 P
l
n
2z
n 2
l
P 1 P
L = 2z
2
P 1 P
0.5(1 0.5)
2z
l
n
n
2
n 2
l
Ejemplo:
179
0.25(1 0.25)
0.25(1 0.25)
, 0.25 + 2.58
0.25 2.58
= [0.15558, 0.34441]
140
140
b) Buscamos el tamao n de la muestra tal que con un 95% de confianza la proporcin muestral P
est a una distancia 0.03 de la proporcin poblacional p, es decir buscamos n tal que
L
n 2
l
2 1.96
P
1
P
=
0.25(1 0.25) = 800.3333
2 0.03
Por lo tanto hay que tomar una muestra de tamao por lo menos 801. como ya se tom una muestra de tamao 140, hay que tomar otra adicional de tamao 801 140 = 661
Supongamos que no tomamos una muestra inicial, entonces directamente planteamos
2
z
2
1.96
n 2 =
= 1067.1111
2 0.03
l
Entonces hay que tomar una muestra de tamao 1068 por lo menos.
180
P1 P2 ( p1 p 2 )
Z=
p1 (1 p1 ) p 2 (1 p 2 )
+
n1
n2
p1 (1 p1 ) p2 (1 p2 )
con
+
n1
n2
mos
Z=
P1 1 P1 P2 1 P2
y entonces
+
n1
n2
P1 P2 ( p1 p 2 )
N (0,1) aproximadamente.
P1 1 P1
P2 1 P2
+
n1
n2
P1 P2 z
P1 1 P1 P2 1 P2
+
; P1 P2 + z
n1
n2
2
P1 1 P1 P2 1 P2
+
n1
n2
Entonces
Si P1 y P2 son las proporciones muestrales de una observacin de dos muestras aleatorias independientes de tamaos n1 y n 2 respectivamente que verifican la propiedad de inters, entonces
un intervalo de confianza de nivel 1 aproximadamente es
P1 P2 z
P1 1 P1 P2 1 P2
+
; P1 P2 + z
n1
n2
2
P1 1 P1 P2 1 P2
(8.11)
+
n1
n2
Ejemplo:
Se lleva a cabo un estudio para determinar la efectividad de una nueva vacuna contra la gripe. Se
administra la vacuna a una muestra aleatoria de 3000 sujetos, y de ese grupo 13 contraen gripe.
Como grupo de control se seleccionan al azar 2500 sujetos, a los cuales no se les administra la vacuna, y de ese grupo 170 contraen gripe. Construya un intervalo de confianza de nivel 0.95 para la
diferencia entre las verdaderas proporciones de individuos que contraen gripe.
181
Solucin:
Sean las variables aleatorias
X 1 : nmero de personas que contraen gripe del grupo que recibi la vacuna
X 2 : nmero de personas que contraen gripe del grupo que no recibi la vacuna
Entonces X1~B(n1,p1) ; X2~B(n2,p2) donde n1 = 3000 ; n 2 = 2500
13
170
Adems P1 =
; P2 =
3000
2500
Y 1 = 0.95
z = z 0.025 = 1.96
2
Entonces
P1 P2 z
P1 1 P1 P2 1 P2
+
; P1 P2 + z
n1
n2
2
P1 1 P1 P2 1 P2
=
+
n1
n2
13
13 170
170
1
170
3000 3000 2500 2500
13
=
1.96
+
;
3000
2500
3000 2500
13
13 170
170
1
13
170
+ 1.96
+
= 0.0738112; 0.0535222
3000 2500
3000
2500
182