Documentos de Académico
Documentos de Profesional
Documentos de Cultura
(intervalos de Confianza)
Estimación Puntual
Propiedades deseables de los estimadores
Estimaciones puntuales (media, proporción, varianza)
que describen
Existe una
Parámetros
Población
Poblacionales
Sean ˆ1 y ˆ2 cualesquiera dos estimadores insesgados de . Se dice que ˆ1 es un
estimador más eficiente de que ˆ2, si V (ˆ1 ) V (ˆ2 ) , cumpliéndose la
desigualdad en el sentido estricto para algún valor de . El cociente
V(ˆ1 )
e=
V(ˆ2 )
se llama eficiencia relativa de ˆ1respecto a ˆ2, y su valor está entre 0 y 1
(0 e 1). Si e está próximo aˆ10 es mejor que ˆ2 .
Estimación puntual
Estimación puntual
Estimación de la Media Poblacional:
E[ X ] = V( X ) =
2
n
en donde y 2 son la media y la varianza de la distribución de la
población, a partir de la cual se obtuvo la muestra. Nótese que
conforme el tamaño de la muestra crece, la precisión de la media
muestral para estimar la media poblacional aumenta (es un estimador
consistente).
Estimación puntual
1 n
X = xi
n i=1
1 n 1 n
1 n 1
E[ X ] = E[ xi ] = E[ xi ] = E[ xi ]= n
n i=1 n i=1 n i=1 n
E[ X ] = c. q. d Es centrado
1 n 1 n
1 n 1
V( X ) = V( xi ) = 2 V( xi ) = 2 V( xi )= 2 n 2
n i=1 n i=1 n i=1 n
1
V( X ) = 2 c. q. d.
n
2
lim n V( X ) = lim n = 0 Es consistent e
n
Estimación puntual
Ejemplo:
506 508 499 503 504 510 497 512 514 505 493 496 506 502
509 496
Solución:
1 16
X
16 i 1
xi 503.75 gramos.
Estimación puntual
Estimación de la Varianza Poblacional:
Cuando se desconoce la media poblacional , debemos sustituir este
parámetro por su estimador muestral, y el estimador a usar para la
varianza poblacional, que es centrado o insesgado sin importar cuál sea la
distribución de la población de interés, es la cuasivarianza muestral S2.
2
n
n
n X X i
2
i
1 n i 1
Xi X
2
Demostración: ˆ = S =
2 2
i 1
n - 1 i 1 n(n 1)
2 2 4 2 2 4
V( S ) = con lo que lim n V( S ) = lim n = 0 Es consistente
n n
Estimación puntual
1 n
E[ S 2 ] = E
2
( Xi - X ) E
1 n
(n - 1) (X i - ) - ( X -
)
2
=
(n - 1) i=1 i=1
1 n n n
= E ( xi - )2+ ( X - )2- 2 ( xi - )( X - ) =
(n - 1) i=1 i=1 i=1
1 n n
= E ( xi - ) + n( X - ) - 2( X - ) ( xi - )=
2 2
(n - 1) i=1 i=1
n
n
x i
E ( xi - )2 + n( X - )2 - 2n( X - )( X - ) ya que X = i=1
1
(n - 1) i=1 n
1 n
= E ( xi - )2- n( X - )2 =
(n - 1) i=1
1 n 2
2
(n - 1) i=1
= E[( x i - ) ] - n E[( X - ) ] =
=
1
(n - n
2 2
)=
2
(n - 1) = 2
(n - 1) n (n - 1)
E[ S 2 ] = 2 c. q. d. Es centrado
Estimación puntual
Si hubiésemos utilizado como estimador, la varianza muestral (desconociendo
la media poblacional), no sería una estimación insesgada o centrada:
1 n 2 1 n
2
E[ ˆ ] = E ( xi - X ) E ( xi - ) - ( X - ) =
2
n i=1 n i 1
n n n
1
= E[ ( xi - )2+ ( X - )2-2 ( xi - )( X - ) ] =
n i=1 i=1 i=1
n n
1
= E[ ( xi - ) +n( X - ) - 2( X - ) ( xi - ) ] =
2 2
n i=1 i=1
n
xi
= E[ ( xi - )2+n( X - )2 - 2n( X - )( X - )] ya que X = i=1
n
1
n n
i=1
n
1
= E[ ( xi - )2-n( X - )2 ] =
n i=1
1 n 1
= [ E[( xi - )2 ] - n E[( X - )2 ]] =
n i=1 n
1 n 2 )= 1 n 2 - 2 = 2 - 2
xi
2
= E[( - ) ] -
n i=1 n n n n
E[ ˆ 2 ] = 2 -
2 No es centrado y su sesgo es 2
n n
Estimación puntual
Ejemplo:
5 3 34 18 27 14 8 50 38 43 35 20 70 25 60 19
Solución: 2
n
n
2 n xi2 xi
S
2 1 n
X i X i 1 i 1 377.2958
n 1 i 1 nn 1
Estimación puntual
Estimación de la Proporción:
Tenemos una población dividida en dos subconjuntos, en función de una
característica determinada, de forma que la proporción de la población que
posee la característica es p, y la de los que no la poseen es 1-p. Tratamos de
p̂
estimar el valor de p. El estadístico dado por la expresión siguiente, es un
estimador centrado y consistente de la proporción poblacional.
casos favorables
Demostración: pˆ
casos totales
1 n 1 1 1
E[pˆ ] = E xi = n E[ xi ] = p c. q. d. Es centrado E[pˆ ] = E[X] = n p = p con la binomial
n i=1 n n n
1 n 1 n 1 p(1 - p)
V(pˆ ) = 2 V xi = 2 V( xi )= 2 n p (1 - p) =
n i=1 n i=1 n n
X 1
V(pˆ ) = V = 2 n p (1 - p) =
p(1 - p) p(1 - p)
con la binomial lim n = 0 c. q. d. Es consistente
n n n n
Estimación puntual
Ejemplo:
Solución: 415
p 0.83
500
Estimación por intervalos
Una estimación por intervalo de un parámetro poblacional es un intervalo de
la forma L1 < < L2, donde L1 y L2 dependen del valor del estadístico ˆ para
una muestra particular y también de la distribución muestral de ˆ. Un intervalo
de confianza al nivel de confianza (1-) 100% (donde 0 < < 1) para el
parámetro poblacional , a partir de una muestra seleccionada, es un intervalo
aleatorio tal que:
P (L1 < < L2) = 1 -
El intervalo de estimación indica, por su longitud, la precisión de la estimación
puntual. El intervalo L1 < < L2, que se calcula a partir de la muestra
seleccionada, se denomina entonces intervalo de confianza del (1 - ) 100%, la
fracción (1- ) recibe el nombre de coeficiente de confianza o grado de
confianza, y los puntos extremos L1 y L2, se llaman límites de confianza inferior
y superior.
Ya que muestras distintas generalmente dan valores distintos de ˆy, por tanto,
de L1 y L2, estos puntos extremos del intervalo son los valores de las variables
aleatorias correspondientes L1 y L2.
Estimación por intervalos
donde si x1, x2, ..., xn es una m.a.s. de una población de media y varianza
2 conocida
2
X-
X N( , ) Z= N(0,1)
n
n
Estimación por intervalos
P - z < Z < z = 1 -
2 2
P - z <
2
X
-
< z = 1 -
2
n
P - z < X - < z = 1 - P - z - X < - < z - X = 1 -
2 n 2 n 2 n 2 n
P - z + X > > z + X = 1 - P X - z < < X + z = 1 -
2 n 2 n 2 n 2 n
Por tanto:
Si X es la media de una m.a.s. de tamaño n de una población, aproximadamente
normal, con varianza conocida 2, el intervalo de confianza de (1 - ) 100% para
la media poblacional es :
X - z < < X + z
2 n 2 n
donde z/2 es el valor de z a la derecha del cual se tiene un área de /2
Estimación por intervalos
Ejemplo:
Los datos siguientes representan los pesos en gramos del contenido de 16
cajas de cereal que se seleccionaron al azar de un proceso de llenado con el
propósito de verificar el peso promedio.
506 508 499 503 504 510 497 512 514 505 493 496 506 502
509 496
Si el peso de cada caja de cereal es una v. a. normal con una desviación
típica = 5 gr., obtener el intervalo de confianza estimado del 95% para la
media de llenado de este proceso.
Solución:
Para el coeficiente de confianza de 95%, =0.05. El valor de z0.025 se
obtiene de la tabla normal y es de 1.96, ya que P(z >1.96) = 0.025. A partir
de los datos muestrales, se obtiene que:
1 16 gramos.
X i
16 i 1
x 503.75
Estimación por intervalos
Entonces, el intervalo de confianza al 95% para la media del proceso de
llenado es:
5
L2= x z = 503.75 + 1.96 * = 506.2
2 n 16
S S
X - t < < X + t
2 n 2 n
donde t/2 es el valor t con (n-1) grados de libertad, lo que deja un área de /2 a
la derecha.
Estimación por intervalos
Ejemplo:
Los contenidos de 7 recipientes similares de ácido sulfúrico son: 9.8, 10.2,
10.4, 9.8, 10, 10.2, 9.6 litros. Encuentre un intervalo de confianza del 95%
para la media de todos los recipientes, suponiendo una distribución
aproximadamente normal.
Solución:
La media muestral y su desviación estándar para los datos que se dan son:
X = 10 S=0.283
t0.025 = 1.94 para 6 grados de libertad. Tabla Student libro Probabilidades y
Estadística de Schaums)
= 1 +2
2 2
Estimación diferencia de medias
X 1- X 2
n1 n2
n1 n2
caerá entre -z/2 y z/2 con una probabilidad (1 - ).
P(-z/2 < Z < z/2) = 1 -
sustituyendo Z por la expresión anterior y siguiendo los mismos pasos
que en casos anteriores, obtenemos:
Si X 1 y X 2 son las medias de muestras aleatorias independientes de
tamaños n1 y n2 de poblaciones aproximadamente normales, con
varianzas conocidas 12 y 22 respectivamente, un intervalo de confianza
de (1 - ) 100% para 1 - 2 es:
n1 1s 21 n2 1s 2 2 9 * 1.611 9 * 1.533
2
Sp
n1 n2 2 = 18 1.5722
Sp = 1.2538
(1-)100% = 95% = 0.05 /2 = 0.025 1 1 2
0.447
t0.025,18 = 1.73 x1 x 2 = 6.71 - 4.72 = 1.99 10 10 10
Entonces, el intervalo de confianza al 95% para la diferencia de medias es:
Estimación por intervalos
L1= x x t
1 2
2
Sp
1 1
n1 n2
= 1.99 – 1.73*0.5607= 1.019
L2= x
1
x2 t Sp
2
1 1
n1 n2
= 1.99 + 1.73*0.5607= 2.960
Calcule el intervalo de confianza del 90% para la diferencia entre los tiempos
promedio de duración de las películas que producen las dos compañías.
Suponga que el tiempo de duración tiene una distribución aproximadamente
normal.
Solución:
n1 = 5 t0.05,7 = 1.833
n2 = 7 x1 x 2 = 98.4 - 110.7 = -12.31
(1-)100% = 90% = 0.10 /2 = 0.05
s12= 1 (21.16+19.36+134.56+129.96+0.16)=76.3
4
s22= 41 (188.08+824.51+151.94+350.22+4132.65+515.94+53.08)=1036.07
Estimación por intervalos
2
s12 s2 2
2
76 .3
1036 .07
n 15.26 148.01
2
v 1 n 2
5 7
26657.09
7.186 7
2 2
s1 s2 2 2
76 .3
2
1036 .07
2
58.217 3651.16 3709.38
n n 5 7
1 2
n1 1 n2 1 4 6
L1= x1 x2 t 2
2 2
s1 s
2 = -12.314 - 1.833*12.78= -35.74
n1 n2
L2= x1 x2 t
2 2
s1 s
2 = -12.314 + 1.833*12.78= 11.11
2 n1 n2
d =
2 1
+ 2
n1 n2
Se estima d2 por Sd2, la varianza de las diferencias que constituyen la
muestra. El estimador puntual de d lo representa , la media
d de las diferencias
que constituyen la muestra. Una vez obtenidas las diferencias, su estudio se
reduce al caso de estimación de la media desconocida de una población
aproximadamente normal, desconocida su varianza (ya visto anteriormente).
Estimación por intervalos
El estadístico a utilizar en esta ocasión es: d - d
T=
Sd
n
que sigue una distribución t con (n-1) grados de libertad. Obtener el intervalo
de confianza es la rutina de siempre.
Nivel de calcio
Parcela Antes Después Diferencia
1 50 9 41
2 50 18 32
3 82 45 37
4 64 18 46
5 82 18 64
6 73 9 64
7 77 32 45
8 54 9 45
9 23 18 5
10 45 9 36
11 36 9 27
12 54 9 45
Estimación por intervalos
Solución:
d = 40.583
Sd =15.79
Sd 15.79
L1= d - t/2 = 40.583 - 2.201* = 30.5504
n 12
15.79
L2= d + t/2 Sd = 40.583 + 2.201* = 50.616
n 12
Estimación por intervalos
Estimación de la proporción:
Un estimador puntual de la proporción p en un experimento binomial está
dado por el estadístico p̂ = X/n donde X representa el nº de éxitos en n intentos
y sigue una distribución binomial de parámetros n y p.
n
1 p
xi = X = xi B(n, p)
0 (1 p) i=1
Solución:
pˆ
415
0.83 1- = 0.95 = 0.05 /2 = 0.025 z0.025 = 1.96
500
pˆ 1 pˆ 0.83 * (1 0.83)
L1 pˆ z 0.83 1.96 0.83 3.2926 *10 2 0.7971
2 n 500
pˆ 1 pˆ 0.83 * (1 0.83)
L2 pˆ z 0.83 1.96 0.83 3.2926 *10 2 0.8629
2 n 500
Estimación por intervalos
Estimación de Diferencia de Proporciones:
Deseamos estimar la diferencia entre dos parámetros binomiales p1 y p2. Para
establecer un intervalo de confianza para p1-p2 consideraremos la distribución
muestral de pˆ 1 pˆ 2
están distribuidos cada uno en forma
X X
pˆ 1 = 1 y pˆ 2 = 2 aproximadamente normal, con medias p1 y p2 y
n1 n2 varianzas p1 (1 - p1 ) p 2 (1 - p 2 )
y
n1 n2
respectivamente. Al seleccionar muestras independientes de las dos
poblaciones, las variables p1 y p2 serán independientes y entonces pˆ 1 pˆ 2 estará
distribuida aproximadamente normal con media :
pˆ - pˆ = p1 - p 2
1 2
y varianza:
p1 (1 - p1 ) p 2 (1 - p 2 )
2
pˆ 1- pˆ 2 = +
n1 n2
Estimación por intervalos
Por tanto se puede asegurar que P(- z 2 < z < z 2 ) = 1 -
donde Z = ( pˆ 1 - pˆ 2 ) - ( p1 - p2 )
p1 (1 - p1 ) p2 (1 - p2 )
+
n1 n2
Siguiendo todos los mismos pasos que en los demás casos, obtenemos:
Solución:
Con la información suministrada podemos calcular:
pˆ1 1 pˆ1 pˆ 2 1 pˆ 2 0.82 * 0.18 0.77 * 0.23
0.03436
n1 n2 250 300
Además sabemos que 1- = 0.90 = 0.1 /2 = 0.05 z0.05 = 1.645
pˆ 1 1 pˆ 1 pˆ 2 1 pˆ 2
L1 pˆ 1 pˆ 2 z 0.05 1.645 * 0.03436 0.00653
2 n1 n2
pˆ 1 1 pˆ 1 pˆ 2 1 pˆ 2
L2 pˆ 1 pˆ 2 z 0.05 1.645 * 0.03436 0.10653
2 n1 n2
Estimación por intervalos
Estimación de la Varianza:
Si se toma una muestra de tamaño n de una población normal con varianza 2
y se calcula la cuasivarianza muestral S2, esta varianza calculada se puede
utilizar como estimación puntual de 2. Para establecer una estimación de
intervalo de 2 se utiliza el estadístico 2
(n - 1) S
2 =
2
que, como ya sabemos, sigue una distribución 2 con (n-1) grados de libertad
cuando las muestras se seleccionan de una población normal. Siguiendo todos
los mismos pasos que en casos anteriores, obtenemos:
2 2 2 (n - 1) S 2 2
P < < = 1 -
2
P < <
= 1-
2 1
2 21
2
2
2 2
1 1
(n - 1) S 2 (n - 1) S
2
P 2
< < 2
= 1 - P < 2
< = 1-
S
2 2 2 2 2
(n - 1) (n - 1) S
1
2 2
Estimación por intervalos
Si s2 es la cuasivarianza de una muestra aleatoria de tamaño n de una población
normal, un intervalo de confianza del (1-)100% para 2 es:
(n - 1) s 2 (n - 1) s 2
< <
2
2
21-
2 2
donde 2/2 y 21 - /2 son valores de una distribución 2 con (n-1) grados de
libertad, con áreas de /2 y 1- /2 a la derecha, respectivamente.
x i 19407
2 2
n
x i
1 i 1 i 1
S
2
377.2958
n 1 i 1 n n 1 i 1
16
L1
n 1S 2
15 * 377.2958
226.41 L2
n 1S 2
15 * 377.2958
779.43
2 0.05,15 24.996 2
0.95,15 7.261
S2
1
2
2 S /
2
2
2
2
2 S2 1 2 2 S1 1 2 S1
2 2
S1 1 S1 1 S1 1 1
2 2 2 2
1 1 S
P > 2> = 1- P < 2 < f ( v2 ,v1 ) 2 = 1 -
f 1 ( v1,v2 ) S 2 2 f ( v1,v2 ) S 2 f ( v1,v2 ) S 2 2 S2
2 2 2
2
2 2 2
Estimación por intervalos
Si s12 y s22 son las cuasivarianzas de muestras independientes de tamaños n1 y n2
respectivamente de poblaciones normales, entonces un intervalo de confianza del
(1-) 100% para 12/22 es:
S1
2
1 2
1
2
S1
< 2 < 2 f ( v2 ,v1 )
S 2 f ( v1,v2 ) 2 S 2 2
2
2
donde f/2 (v1,v2) es el valor f con v1 = (n1 -1) y v2= (n2-1) grados de libertad con un
área de /2 a la derecha, y f/2 (v2,v1) es un valor similar f con v2= (n2-1) y v1=(n1-
1) grados de libertad.
Solución:
n1 = 5 n2 = 7
1- = 0.90 = 0.1 /2 = 0.05
1 1 1
0.221 f0.05 (6,4) = 6.16
f v1,v 2
f0.05 4,6 4.53
2
n= 2
Tamaño de la muestra
Queremos que X , es decir X X
z
2
n= 2
pˆ (1 - pˆ )
z
2 n
Si deseamos determinar qué tan grande debe ser una muestra para
asegurar que el error al estimar p será menor que una cantidad
especificada , tendremos que escoger una n, de tal forma que
pˆ (1 - pˆ )
z =
2 n
y ese valor de n es: ( Z )2 pˆ (1 - pˆ )
2
n=
2
Tamaño de la muestra
La expresión anterior puede resultar paradójica ya que para calcular p̂ ya
debemos conocer n porque pˆ X n . Tenemos entonces dos opciones:
a) Obtener una muestra con n 30 valores, a partir de la cual calcular
la aproximación pˆ X n y usar esta aproximación para calcular cuantas
observaciones serían necesarias para obtener la precisión deseada.
b) Establecer un límite superior para el valor de n observando que
pˆ (1 pˆ ) es como máximo ¼, ya que p̂ cae entre 0 y 1. El valor máximo de
n sería entonces:
( Z )2
2
n=
42
Solución:
Si suponemos que tenemos una buena estimación previa de p:
13
pˆ = = 0.9286
14
(1 - )100% = 99% = 0.01 z = 2.58
2
= 0.02
( z )2 pˆ (1 - pˆ ) (2.28 )2 (0.9286)(0.0714)
n= 2
= = 1103.33 1104
2
2
(0.02 )
Tamaño de la muestra
Si lo hacemos sin considerar la estimación previa de p, sino considerando el
máximo:
( z )2 (2.58 )2
n= 2 2 = = 4160.25 4161
4 4 (0.02 )2
Se pide:
a) Construir un intervalo de confianza del 95% para la diferencia de
vida media de cada tipo de esquema.
b) Construir un intervalo de confianza del 90% para el cociente de
varianzas de la vida de cada tipo de esquema.
Ejercicios
Ejercicio 6.2
Una agencia de alquiler de automóviles necesita estimar el número
medio de kilómetros diarios que realiza su flota de automóviles; a tal fin,
en varios días de la semana toma los recorridos de 100 vehículos de su
flota y obtiene que la media muestral es de 165 Km/día, y la
cuasidesviación típica muestral de 6 Km/día. Se pide:
a) Bajo la hipótesis de normalidad de la característica de estudio (nº de
km por día), construir un intervalo de confianza para la media de dicha
distribución a un nivel de confianza del 95%.
b) Bajo la misma hipótesis de normalidad que en a), construir un
intervalo de confianza del 90% para la varianza de dicha distribución.
Ejercicios
Ejercicio 6.3
En un cruce de Melanogaster se han obtenido 60 moscas con alas
vestigiales de un total de 300. Se pide:
a) Encontrar un intervalo de confianza al 95% para la proporción de
moscas con alas vestigiales entre los individuos resultantes de un gran
número de cruces como este.
b) Qué número de cruces hay que realizar de modo que la proporción de
moscas con alas vestigiales entre los individuos resultantes de un gran
número de cruces y la de la muestra difiera en valor absoluto en menos
de 0.01 con una probabilidad del 95%?