Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Intervalos - Confianza PDF
Intervalos - Confianza PDF
Intervalos de conanza
Como su nombre indica, el objetivo de un estadstico puntual para un parametro desconocido
de una poblacion, es acercarnos al verdadero valor del mismo dando un valor concreto a partir de
una muestra. Difcilmente esta estimacion acertara con el valor exacto del parametro. No obstante,
la pretension de dar con dicho valor puede ser excesiva, y podemos relajarla buscando simplemente
una aproximacion razonable del mismo. En esta lnea surgen los intervalos de conanza, para un
nivel de conanza dado.
1.
Deniciones
Denici
on 1.1. Sea (X1 . . . XN ) una muestra aleatoria de una poblacion X con funcion de masa
P (o funcion de densidad f ), donde = (1 . . . k ) . Un estimador por intervalos de conanza
de i (al nivel de conanza 1 ), es una funcion que a cada posible muestra x1 . . . xN le hace
corresponder un intervalo (T1 T2 ) = (T1 (x1 . . . xN ) T2 (x1 . . . xN )), tal que, para todo :
Denici
on 1.2. Sea (X1 . . . XN ) una muestra aleatoria de una poblacion X con funcion de masa
P (o funcion de densidad f ), donde = (1 . . . k ) . Una cantidad pivotal para i es una
funcion C(X1 . . . XN ; i ) tal que su distribucion no depende de .
Una vez obtenida una cantidad pivotal C(X1 . . . XN ; i ), la construccion de un intervalo para
estimar es el siguiente:
- se eligen dos valores c1 y c2 tales que:
84
2.
Poblaciones normales
= E[X] =
E[X]
Por otra parte, X1 . . . XN son variables aleatorias independientes, todas con la misma distribucion,
N ( ; ), y as
N ( ; / N ) .
X
Por otra parte, el estimador cuasivarianza muestral
N
S2 =
1
2
(Xi E[X])
N 1 i=1
tiene esperanza
E[S 2 ] = 2 .
Necesitaremos conocer la distribucion seguida por este estadstico. Se tiene la siguiente denicion:
Denici
on 2.1. Distribuci
on 2 ) Sean Z1 . . . ZN variables aleatorias independientes, todas con
distribucion N (0 ; 1). La distribucion 2 de Pearson con N grados de libertad (abreviadamente
2N ) es la distribucion de la variable aleatoria
N
Zi2 .
i=1
Esta distribucion esta asociada a la distribucion normal, y sus valores vienen dados por una tabla.
Es claro que si (X1 . . . XN ) es una muestra aleatoria de una poblacion X N ( ; ), entonces:
N 1 2
S =
2
=
(Xi )2
i=1
N
i=1
de manera que:
2 (Xi + X)
2
(Xi X)
=
2
2
i=1
(Xi )2
i=1
N
2N
N
)2
(X
X
2
)
+
(X
i
2
2
i=1
)2
)2
(X
(X
(Xi )2
2N
+
N
2
2
2
i=1
2
N
)2
(X
(Xi )2
X
2
=
N
= N
2N 1 .
2
2
/
N
i=1
=
2. POBLACIONES NORMALES
85
Propiedad: [Lema de Fisher] Sea (X1 . . . XN ) una muestra aleatoria de una poblacion X con
distribucion N ( ; ). Entonces:
N ( ; / N ) ;
X
N 1 2
S 2N 1 ;
2
y S 2 son independientes.
y, ademas, X
Igual que para la distribucion de la cuasivarianza de N variables aleatorias independientes con
igual distribucion N ( ), hemos introducido una nueva distribucion, necesitaremos las siguientes
nuevas deniciones.
Denici
on 2.2. Distribuci
on t de Student) Sean Y , X1 . . . XN variables aleatorias independientes, todas con distribucion N (0 ; 1). La distribucion t de Student con N grados de libertad
(abreviadamente tN ) es la distribucion de la variable aleatoria
1
N
Y
N
2
i=1 Xi
Y
1
N
.
2N
Denici
on 2.3. Distribuci
on F de FisherSnedecor) Sean X1 . . . Xm , Y1 . . . Yn variables
aleatorias independientes, todas con distribucion N (0 ; 1). La distribucion F de FisherSnedecor
con m y n grados de libertad (abreviadamente Fm;n ) es la distribucion de la variable aleatoria
1
m
1
n
2.1.
m
X2
ni=1 2i =
i=1 Yi
1
m
1
n
2m
.
2n
Recogemos, de manera resumida, las principales cantidades pivotales utilizadas para la construccion de estimadores por intervalos de conanza, para el caso de una poblacion X N ( ; ).
Distinguiremos el caso de un muestra y el de dos muestras.
Cantidades pivotales para el caso de una muestra
a) Sea (X1 . . . XN ) una muestra aleatoria de una poblacion X N ( ; ), con conocido.
Entonces:
X
N (0 ; 1) y es una cantidad pivotal para .
/ N
b) Sea (X1 . . . XN ) una muestra aleatoria de una poblacion X N ( ; ). Entonces:
X
tN 1 es una cantidad pivotal para
S/ N
N 1 2
S 2N 1 es una cantidad pivotal para 2 .
2
86
X
/ N
= tN 1
1 N 1 2
S/ N
S
2
N 1
por denicion de la distribucion t de Student con N 1 grados de libertad.
Cantidades pivotales para el caso de dos muestras
a) Sean (X1 . . . Xm ) e (Y1 . . . Yn ) muestras aleatorias independientes de las poblaciones
X N (1 ; ) e Y N (2 ; ), respectivamente. Entonces:
Y (1 2 )
X
2
(m 1)SX
+ (n 1)SY2
m+n2
2
y SY2 ,
puede interpretarse como una ponderacion de las cuasivarianzas muestrales SX
correspondientes a cada una de las muestras.
Sp2 =
de ah la armacion del apartado b). La comprobacion del primer apartado excede el nivel de
este curso, y no se abordara.
2.2.
Utilizando las cantidades pivotales del apartado anterior, es sencillo obtener intervalos de conanza para los parametros de una poblacion normal. Distinguiremos diferentes casos:
Primer caso:
Sea (X1 . . . XN ) una muestra aleatoria de una poblacion X N ( ; ), con conocido. Entonces:
+ z/2
z/2 X
X
N
N
es un intervalo de conanza para al nivel 1), siendo z el valor que verica P (Z > z ) = ,
para Z N (0 ; 1).
2. POBLACIONES NORMALES
87
Segundo caso:
Sea (X1 . . . XN ) una muestra aleatoria de una poblacion X N ( ; ). Entonces:
+tN 1 ; /2 S
tN 1 ; /2 S X
es un intervalo de conanza para al nivel 1),
X
N
N
siendo tN ; el valor que verica que P (tN > tN ; ) = .
(N 1)S 2 (N 1)S 2
es un intervalo de conanza para 2 al nivel 1 ), siendo
b)
2N 1 ; /2 2N 1 ; 1/2
2N ; el valor que verica: P (2N > 2N ; ) = .
a)
Tercer caso:
Sean (X1 . . . Xm ) e (Y1 . . . Yn ) muestras aleatorias independientes de dos poblaciones normales
con igual desviacion tpica: X N (1 ; ) e Y N (2 ; ) , respectivamente. Entonces:
1
1
1
1
Y + tm+n2 ; /2 Sp
Y tm+n2 ; /2 Sp
+ X
+
X
m n
m n
es un intervalo de conanza para la diferencia de medias, 1 2 al nivel 1 ).
Cuarto caso:
Sean (X1 . . . Xm ) e (Y1 . . . Yn ) muestras aleatorias independientes de dos poblaciones normales:
X N (1 ; 1 ) e Y N (2 ; 2 ) , respectivamente. Entonces:
2
2
SX
/SY2
/SY2
SX
2.3.
Ejemplos
Ejemplo 36 Una empresa fabrica bombillas cuya duracion en horas sigue una distribucion N ( ; 200).
Una muestra aleatoria de 36 bombillas ha dado una vida media de 7000 horas. Constr
uyase un intervalo de conanza al nivel del 99 para la vida media de las bombillas fabricadas por esa fabrica.
n: Tenemos una muestra de tama
Solucio
no N = 36 de una poblacion, X N ( ; 200), de varianza
conocida. Usaremos la cantidad pivotal:
X
N (0 ; 1) ;
200/6
y, para = 0.01, repartimos la probabilidad de manera equitativa a izquierda y derecha de la media
muestral x = 7000. En otras palabras, consideramos la igualdad:
7000
P c<
< c = 1 = 0.99 .
200/6
88
De la tabla para una N (0 ; 1) se tiene c = z/2 2.58 (pues /2 = 0.005). Construimos el intervalo
de conanza para , al nivel del 99 %, despejando en las desigualdades:
2.58 <
7000
< 2.58
200/6
de manera que:
21000 + 258
21258
200
2.58 =
=
= 7086
6
3
3
21000 258
20742
200
2.58 =
=
= 6914
> 7000
6
3
3
< 7000 +
Resumiendo, el intervalo de conanza para al nivel del 99 % para la muestra dada es:
200
200
2.58 7000 +
2.58 = (6914 7086) .
I = 7000
6
6
Ejemplo 37 Una muestra aleatoria de 16 cigarrillos de una cierta marca tiene un contenido medio
de nicotina de 1.6mg. y una desviacion tpica de 0.7mg. Suponiendo que la variable X =contenido
de nicotina en un cigarrillo, sigue una distribucion N ( ; ), obtengase un intervalo de conanza
al 99 del contenido medio de nicotina por cigarrillo en esa marca.
n: En este caso se quiere estimar en una poblacion N ( ; ), con ambos parametros
Solucio
desconocidos. Partimos de una muestra de tama
no N = 16, con x = 1.6 y cuasidesviacion tpica
muestral
16
s = 0.72 0.723 .
15
Sabemos que en este caso hemos de usar la cantidad pivotal:
1.6
x
=
0.723/4
s/ N
que sigue una distribucion t de Student con N 1 = 15 grados de libertad. Para la muestra dada, el
intervalo de conanza para al nivel de conanza 1 queda
s
s
0.723
0.723
= 1.6 t15 ; /2
x tN 1 ; /2 x + tN 1 ; /2
1.6 + t15 ; /2
4
4
N
N
siendo t15 ; /2 el valor tal que P (t15 > t15 ; /2 ) = /2. Como en nuestro caso 1 = 0.99 entonces
= 0.01 y as, de la correspondiente tabla para la distribucion t de Student, obtenemos:
t15 ; /2 = t15 ; 0.005 = 2.947 .
El intervalo que nos piden es pues:
0.723
0.723
0.723
0.723
= 1.6 2.947
1.6 t15 ; /2
1.6 + t15 ; /2
1.6 + 2.947
4
4
4
4
(1.6 0.5327 1.6 + 0.5327)
= (1.0673 2.1327) .
2. POBLACIONES NORMALES
89
Observaci
on: En este ejemplo hemos tenido que calcular la cuasidesviacion t
pica muestral a
partir de la desviacion tpica muestral. Si seguimos el uso dado, denotando por v la desviacion
v NN1
s
v N
v
=
=
=
N 1
N
N
N N 1
Podramos haber expresado el intervalo de conanza utilizando la desviacion tpica muestral:
v
v
x tN 1 ; /2
x + tN 1 ; /2
N 1
N 1
pero no usaremos esta expresion, para no liar la notacion. Tan solo hemos de tener cuidado al tomar
los datos del problema.
Ejemplo 38 Una muestra aleatoria de una poblacion N ( ; ) ha dado los diez valores siguientes
6.9 ; 5.7 ; 8.4 ; 9.3 ; 7.2 ; 8.5 ; 7.4 ; 9.1 ; 6.5 ; 7.6 .
Constr
uyase un intervalo de conanza de 2 al 95 .
n: Estamos ante una poblacion N ( ; ) de la que desconocemos ambos parametros. Para
Solucio
estimar por intervalos de conanza 2 usaremos la cantidad pivotal
N 1 2
S
2
que sabemos sigue una distribucion 2 con N 1 grados de libertad. As, de la muestra dada, tan
solo usaremos la cuasivarianza muestral:
N
1
2.
S2 =
(Xi X)
N 1 i=1
2N 1 ; /2 2N 1 ; 1/2
9 1.34 9 1.34
(0.634 4.467)
19.023
2.7
como intervalo de conanza para estimar 2 al nivel del 95 %.
90
Ejemplo 39 Se ha ofrecido a un grupo de estudiantes elegir entre dar o no una hora complementaria
de clase semanal. El examen nal fue el mismo para todos los estudiantes. Del curso normal (sin clase
extra), 15 alumnos obtuvieron una puntuacion media de 76 con desviacion tpica 6, y 28 del curso con
hora complementaria una puntuacion media de 84 con desviacion tpica 5. Obtengase un intervalo
de conanza al 90 de la diferencia de puntuaciones medias, suponiendo que las poblaciones son
normales de varianzas iguales.
n: En las condiciones dadas es aplicable el intervalo
Solucio
1
1
1
1
X Y tm+n2 ; /2 Sp
+ X Y + tm+n2 ; /2 Sp
+
m n
m n
con
15
540
=
14
14
700
2
2 28
n = 28 ; y = 84 ; sY = 5
=
27
27
m = 15 ; x = 76 ; s2X = 62
y
(m 1)s2X + (n 1)s2Y
m+n2
540
14 14 + 27 700
1240
27
=
=
15 + 28 2
41
s2p =
Sustituyendo = 1 0.9 = 0.1, obtenemos, de la tabla para una distribucion t de Student con
15 + 28 2 = 41 grados de libertad1 :
t41 ; /2 = t41 ; 0.05 1.684
En denitiva, el intervalo de conanza para 2 al 90 %, dadas las dos muestras, es:
1240 28 + 15
1240 28 + 15
76 84 + 1.684
76 841.684
41
28 15
41
28 15
1240 43
1240 43
6 + 1.684
= 6 1.684
41 28 15
41 28 15
62 43
62 43
6 + 1.684
(8.9633 3.0367) .
= 6 1.684
41 21
41 21
Ejemplo 40 En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos poblaciones aisladas, A1 y A2 , se obtuvieron los siguientes datos:
N1 = 13
N2 = 11
x1 = 4
x2 = 5
s1 = 3
s2 = 2.2 .
En la tabla entregada en clase este dato esta mal escrito: debera poner 1.684 en lugar de 1.648.
3. OTRAS POBLACIONES
91
n: Un intervalo de conanza para el cociente 12 /22 , al nivel 0.80 = 1 con = 0.2, sera:
Solucio
S12 /S22
S12 /S22
3.
y:
F12 ; 10 ; 0.9 =
32 /2.22 32 /2.22
2.2841 1/2.1878
1
1
=
0.4571 .
F10 ; 12 ; 0.1
2.1878
(0.8141 4.0682) .
Otras poblaciones
(1
)
p (1 p)
X z/2
X + z/2
N
N
=frecuencia relativa de
es un intervalo de conanza para p al nivel 1 ), siendo p = X
exitos.
Estamos utilizando la siguiente cantidad pivotal asintotica:
p
X
p(q p)/N
n de Poisson
Intervalos de confianza para una distribucio
Sea (X1 . . . XN ) una muestra aleatoria de una poblacion X Poisson (). Entonces:
X z/2 /N X + z/2 /N
= X.
/N
92
4.
Mnimo tama
no muestral
z/2 X
+ z/2
X
N
N
con lo cual el error cometido sera
Error = z/2 .
N
Siendo = 1 0.95 = 0.05, /2 = 0.025y = 5, se quiere obtener el mnimo valor de N para que:
5
5
z0.025 = 1.96 0.5
N
N
de donde:
5 1.96 2
0.5
= 19.62 = 384.16 .
Es decir, necesitaremos observar 385 elementos para conseguir la precision deseada (error 0.5) para
esa estimacion.
Para otros intervalos, un calculo similar nos llevara a determinar, en cada caso, el mnimo tama
no muestral. Tengase en cuenta que este mnimo tama
no muestral ha de tomarse como un valor
orientativo. As, si obtenemos, para determinada precision, un mnimo tama
no muestral de 196, entenderemos que debemos observar alrededor de 200 elementos. Esto es esencial, sobre todo en los
casos en que el mnimo tama
no muestral depende de la muestra concreta obtenida.
5.
Intervalos de conanza m
as frecuentes
Recogemos por u
ltimo, los intervalos de conanza antes obtenidos, y alg
un otro, en una lista
esquematica. Se utiliza la siguiente notacion
(X1 . . . Xn ) muestra aleatoria (m.a.) de X.
n
1
x =
xi
n i=1
1
s =
(xi x)2
n 1 i=1
2
I = (a ) = (a a + )
FRECUENTES
5. INTERVALOS DE CONFIANZA MAS
93
1. X N ( )
I
=
x
/2
n
Intervalo de conanza 1 para :
I = x tn1;/2
n
desconocida
(n 1)s2
(n 1)s2
2n1;/2
2n1;1/2
x z/2
conocida
x(1 x)
n
x
x z/2
n
2
2
1 2
I = x y z/2
+
n 1 n2
I=
I = x y tf ;/2
1
1
+
n1 n2
s2
s21
+ 2
n1 n2
1 , 2 conocidas
1 2 desconocidas, 1 = 2
1 2 desconocidas, 1 = 2
12 /22 :
s22 /n2 )2
n2 +1
I=
2
s21 /s22
94
x (1 x) y (1 y)
+
n1
n2
6. Datos emparejados
(X Y ) Normal bivariante (1 2 1 2 ).
D = X Y N = 1 2 = 12 + 22 2 1 2
(D1 . . . Dn ) m.a. de D, donde Di = Xi Yi .
Intervalos de conanza 1 para o : aplicar Apartado 1 a la variable aleatoria D
FRECUENTES
5. INTERVALOS DE CONFIANZA MAS
95
Problemas
1. En una poblacion se desea conocer la probabilidad de que un individuo sea alergico al polen de
las acacias. En 100 individuos tomados al azar se observaron 10 alergicos. Hallar el intervalo de
conanza al 95 % para la probabilidad pedida. Cuantos individuos se deberan observar para
que, con el mismo nivel de conanza, el error maximo en la estimacion de la proporcion de
alergicos sea del 0.01?
2. Se supone que el n
umero de erratas por pagina en un libro sigue una distribucion de Poisson.
Elegidas al azar 95 paginas, se obtuvieron los siguientes resultados:
N
umero de erratas
N
umero de paginas
0
40
1
30
2
15
3
7
4
2
5
1
4.
5.
6.
7.
8.
Suponiendo que la duracion sigue una distribucion Normal, hallar los intervalos de conanza
al 90 % para ambos parametros.
La vida activa (en das) de cierto farmaco sigue una distribucion N (1200 ; 40). Se desea enviar
un lote de este farmaco de manera que la vida media del lote no sea inferior a 1180 das, con
probabilidad 0.95. Hallar el tama
no del lote.
Una noticia en el periodico dice que, de 1000 personas encuestadas sobre una cuestion, 556 se
muestran a favor y 444 en contra, y concluye armando que el 55.6 % de la poblacion se muestra
a favor, con un margen de error de 3 %. Cual es el nivel de conanza de esta armacion?
Se quiere estudiar la proporcion p de declaraciones de la renta con alg
un defecto. En una
muestra preliminar peque
na (muestra piloto) de tama
no 50 se han observado 22 declaraciones
defectuosas. Cual es el tama
no muestral necesario para estimar p cometiendo un error maximo
de 0.01 con una probabilidad 0.99?
En una gran zona ganadera se desea estimar la proporcion de ovejas que sufren cierta enfermedad degenerativa. Calcular el tama
no muestral necesario para estimar esta proporcion con un
error menor que 0.03 a un nivel de conanza del 0.95, sabiendo que, en una peque
na muestra
preliminar, se seleccionaron 30 ovejas, de las cuales 2 resultaron padecer la enfermedad.
En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos poblaciones
aisladas, A1 y A2 , se obtuvieron los siguientes datos:
N1 = 13 x1 = 4 s1 = 3
N2 = 11 x2 = 5 s2 = 2.2 .
Suponiendo que el tiempo de desarrollo en la poblacion Ai sigue una distribucion N (i ; i ),
para i = 1 2, se pide:
a) Hallar un intervalo de conanza para el cociente de varianzas al nivel 0.80 .
b) Obtener un intervalo de conanza para 1 2 , con nivel de conanza 0.95 .
c) Cuantos individuos habra que observar para estimar 1 con un error maximo de 0.2 y
un nivel de conanza de 0.95?
96
FRECUENTES
5. INTERVALOS DE CONFIANZA MAS
97
nos de funciona17. Se desea conocer la probabilidad de que una pieza falle en los cinco primeros a
miento. En 100 piezas tomadas al azar se observaron 10 fallos. Halla el intervalo de conanza
de nivel 0.95 para la probabilidad pedida. Cuantas piezas se deberan observar para que, con
el mismo nivel de conanza, el margen de error en la estimacion de la proporcion de fallos sea
de 0.01?
18. En una poblacion, la altura de los individuos varones sigue una distribucion N (; = 7.5).
Halla el tama
no de la muestra para estimar con un margen de error inferior a 2 cm. para
un nivel de conanza 0.90.
19. En una explotacion minera, las rocas excavadas se someten a un analisis qumico para determinar su contenido porcentual de cadmio. Se puede suponer que este contenido es una variable
con distribucion normal de media y varianza 2 . Despues de analizar 25 rocas se obtiene
un contenido porcentual medio de 9.77 con una cuasidesviacion tpica de 3.164. La explotacion comercial de este mineral es economicamente rentable si el contenido medio en la mina es
superior al 8 %.
a) Construye un intervalo de conanza de nivel 95 % para el contenido porcentual medio de
cadmio en la mina.
b) Otro indicador de la calidad de la mina es la uniformidad de su contenido mineral medida
a traves de la varianza , que debe ser menor al 3 %. Construye un intervalo de conanza
de nivel 95 % para 2 .
20. Como parte de un estudio para la reduccion de los gases de efecto invernadero que emiten
los coches, se estudian los efectos de un determinado aditivo que reduce las emisiones. Sea X
el n
umero de kilometros recorridos por un coche con un litro de gasolina sin el aditivo. Sea
Y el n
umero de kilometros recorridos con un litro de gasolina con el aditivo. Se observan los
kilometros recorridos por litro de gasolina en ocho coches, cuatro de ellos sin aditivo. Los datos
que se obtienen son:
4
i=1
xi = 25.4
i=1
yi = 31.2
i=1
x2i
= 173.53
yi2 = 261.22
i=1
a) Suponiendo que el aditivo puede cambiar la media pero no la varianza, y especicando las
hipotesis necesarias, calcula un intervalo de conanza al 95 % para la diferencia de medias.
b) A la vista del intervalo obtenido en a), hay alguna indicacion de que el aditivo tiene alg
un
efecto en el n
umero de kilometros recorridos por litro de gasolina?
21. Se admite que el n
umero de microorganismos en una muestra de 1 mm c
ubico de agua de un
ro sigue una distribucion de Poisson de parametro . En 40 muestras se han detectado, en
total, 833 microorganismos. Calcula un estimador puntual y un intervalo de conanza al 90 %
para .