Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema7 Intervalos de Confianza
Tema7 Intervalos de Confianza
Introducción:
Se ha visto que un estimador es una función de las v. a. que integran una muestra, por
tanto, es una variable aleatoria con una determinada distribución. Una estimación del parámetro
es el valor que toma el estimador ante una realización muestral concreta (recordar el ejemplo
del gasto diario en transporte de una empresa que, una vez extraída una muestra, se obtuvo como
estimación del gasto 279€). La estimación puntual, generalmente no coincide con el verdadero
valor del parámetro , (pero si el estimador tiene buenas propiedades, se obtendrá un valor muy
próximo a en la mayoría de las realizaciones muestrales que se obtengan). Por tanto, sería
deseable acompañar la estimación del parámetro con una medida asociada al posible error que se
pueda cometer.
En realidad se trata de “dada una v.a. poblacional X cuya distribución depende de y dada
una Muestra Aleatoria Simple (MAS) X1, X2, ... , Xn Obtener dos estimadores ˆ1 y ˆ2 tales que
P (ˆ1 ˆ2 ) 1
En donde (1-)% es el nivel de confianza y 1- es el coeficiente de confianza.
Obsérvese que el intervalo es aleatorio porque los extremos son variables aleatorias, ya que
el parámetro es desconocido pero fijo.
Ejemplo:
Se trata de encontrar un intervalo de confianza del 95% para estimar el gasto en transporte
de una determinada empresa, gasto que sabemos se distribuye de forma normal de media µ y
desviación típica 300.
Para ello se toma una muestra aleatoria simple de tamaño 100, por ejemplo, y utilizamos la
media muestral como el mejor estimador de la media poblacional que sabemos que se distribuye
) N ( ,30) o, lo que es lo mismo, Z X N (0,1)
300
X N ( ,
100 30
X
Entonces buscamos dos valores 1 y 2 tales que P (1 2 ) 0,95 y observamos
30
que, para que el intervalo sea lo más estrecho posible, es necesario que 1 = -2 O sea, que
X
1 z / 2 1,96 y 2 z / 2 1,96 con lo que P ( 1,96 1,96) 0,95 que
30
despejando µ se obtiene P (1,96.30 X 1,96.30 X ) 0,95
O sea
P ( X 58,8 X 58,8) 0,95 que quiere decir que hemos encontrado dos estimadores
1 X 58,8 y 2 X 58,8 tales que P (ˆ1 ˆ2 ) 1 =0,95
ˆ ˆ
a) Que para cada muestra en concreto, va a salir un valor distinto de X y, por tanto, para
cada muestra se va a obtener un intervalo de confianza distinto.
b) Que de todos los posibles intervalos de confianza que se puedan obtener, el 95% de
ellos van a contener al verdadero valor del parámetro. (ver gráfico)
c) Que, una vez obtenida una muestra concreta, se obtiene un intervalo concreto y es
incorrecto decir que hay una probabilidad del 95% de que el parámetro esté contenido
en ese intervalo.
Supongamos que obtenemos una muestra concreta 500, 300, 800, … y calculamos su
media muestral que resulta ser 625. Luego µ = 625 es una estimación puntual de la media
poblacional y (625 – 58,8 ; 625 + 58,8) = (566,2 ; 683,8) es un intervalo de confianza para µ del
95% obtenido de esa muestra.
Ojo: No se puede poner P(566,2 µ 683,8) = 0,95 Lo único que se puede hacer es confiar
que el intervalo (566,2 ; 683,8) sea uno de los del 95% que contienen al parámetro µ.
Solamente podemos hablar de probabilidad antes de tomar la muestra.
Se verifica que la amplitud del intervalo vendrá determinado por las anteriores características
verificándose que, manteniendo el estimador escogido.
A mayor nivel de confianza, mayor amplitud del intervalo.
A mayor tamaño de la muestra, menor amplitud del intervalo.
Y si se mantiene constante la amplitud del intervalo, para aumentar la confianza hay
que aumentar el tamaño muestral.
Ejemplos.
Siguiendo con el ejemplo anterior, obtener un intervalo de confianza para la media poblacional,
con la misma muestra obtenida antes, pero para una confianza del 99,7%. Determinar el intervalo
de confianza que se obtendría si aumentamos el tamaño de la muestra a 625.
1 n
1.- Se elige el mejor estimador de que es X Xi
n i1
X
h ( X ) N (0,1) que no depende del parámetro .
2.- Nos fijamos en la función
n
X
P( z 2 z1 2 ) 1
3.- Se construye el intervalo
n
4.- Se despeja el parámetro y queda: P( X z 2 X z1 2 ) 1 con lo que el
n n
intervalo de confianza es ( X z 2
, X z1 2 ) que es el que aparece en el libro de tablas.
n n
(Este resultado también se puede aplicar al caso de poblaciones no normales, pero con un tamaño
muestral grande, para que sea aplicable la aproximación del teorema central del límite).
Ejemplo:
El peso de los cocos producidos por los arboles de una granja se distribuye de forma normal,
con media desconocida pero con = 13 g. Se toma una muestra de ellos y se obtiene que los
pesos son: 700, 700, 680, 680, 690, 710, 670 y 700 gramos. Hallar un intervalo de confianza para
la media con un nivel del 95%.
8.4 .- De una población normal N(,6) se selecciona una muestra aleatoria cuya media es 25. Obtener un
intervalo de confianza para la media poblacional en los siguientes casos.
a) Cuando el tamaño de la muestra es 16 y el nivel de confianza es del 90%.
b) Igual que antes pero con tamaño de muestra igual a 64.
c) Con tamaño de la muestra igual a 16, nivel de confianza del 90% pero = 10.
Con tamaño de la muestra n = 16, confianza del 95% y = 6.
1 n
1.- Se elige el mejor estimador de que es X Xi
n i1
X
2.- Nos fijamos en la función h ( X ) Tn1 que no depende del parámetro .
Sc
n
X
3.- Se construye el intervalo P ( t t1 2 ) 1
2 Sc
n
Sc X t1 2 Sc ) 1 con lo
4.- Se despeja el parámetro y queda: P ( X t 2
n n
que el intervalo de confianza es ( X t 2
Sc , X t Sc ) que es el que aparece en el
1 2
n n
libro de tablas.
Ejemplo:
8.5 .- Un fabricante de una determinada marca de vehículos de lujo sabe que el consumo de gasolina de
sus vehículos se distribuye normalmente. Se selecciona una muestra aleatoria de 6 coches y se observa el
consumo cada 100 Km. obteniendo las siguientes observaciones: 19,2 , 19,4 , 18,4 , 18,6 , 20,5 y 20,8
Obtener los intervalos de confianza para el consumo medio de gasolina de todos los vehículos de esa
marca, a los niveles de confianza del 90, 95 y 99%.
Análogamente:
n
X X
2
( n 1) Sc 2 ( n 1) Sc 2
4.- Se despeja el parámetro 2 y queda: P( 2
) 1 con lo
n21;1 / 2 n21; / 2
(n 1) Sc 2 (n 1) Sc 2
que el intervalo de confianza es 2 , que es el que aparece en el libro
n 1;1 / 2 n 1; / 2
2
de tablas.
Ejemplo:
Utilizar los datos del ejercicio anterior para obtener un intervalo de confianza para la
varianza con un nivel del 95%.
Análogamente se procede en todos los demás casos que aparecen en el libro de tablas cuando
la población se distribuye según una distribución normal.
X
Como el mejor estimador de la proporción es la proporción muestral pˆ en donde X es
n
una distribución binomial de parámetros n y p, que al ser n muy grande, se puede aproximar
pˆ p
p(1 p ) N (01)
por una normal. Se verifica que pˆ N p, O sea:
pq con lo que
n
n
p p
ˆ
P z / 2 z / 2 1 de donde se obtiene el intervalo
pq
n
pq pq
P pˆ z / 2 p pˆ z / 2 1 pero al ser p y q desconocidos se emplea la
n n
expresión anterior pero tomando como valor de p su estimación. Es decir, que el intervalo
pˆ qˆ pˆ qˆ
quedaría: P pˆ z / 2 p pˆ z / 2 1
n n
Ejemplo:
Ejemplo 8.9 Se selecciona una muestra de 600 familias a las cuales se les pregunta si poseen
o no Internet en casa. 240 respondieron afirmativamente, Obtener un intervalo de confianza del
95% para estimar la proporción real de las familias que poseen línea de Internet.
Otro ejemplo: Una determinada empresa compra piezas a un fabricante que le garantiza que
el tanto por cien de piezas defectuosas es inferior al 5%. Como no se fían del fabricante, se
decide hacer un control de calidad para comprobar si es cierto lo que afirma el fabricante. Para
ello se tomó una muestra de 200 piezas elegidas al azar de las que había 19 defectuosas. ¿Se
puede afirmar que se está incumpliendo la garantía con un nivel de confianza del 95%? ¿Y con
un nivel de confianza del 99,7%?
Muchas veces interesa elegir, junto con el nivel de confianza, un intervalo de confianza de
una determinada longitud y determinar cuál debería ser el tamaño muestral adecuado.
Ejemplo:
8.10 .- La longitud de los tornillos fabricados por una determinada máquina se distribuye según una
distribución normal con desviación típica = 2 mm. Con el fin de obtener un intervalo del 99% de
confianza para la longitud media de los tornillos producidos durante un día determinado se toma una
muestra aleatoria de 10 tornillos cuya longitud media resultó ser de 96 mm. Calcular el correspondiente
intervalo con estos datos y determinar el tamaño de la muestra para construir un intervalo al 99% de
confianza para la longitud de los tornillos pero que tenga una amplitud de 2 mm.