Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estimación Puntual
Propiedades deseables de los estimadores
Estimaciones puntuales (media, proporción, varianza)
que describen
Existe una
Sean ˆ1 y ˆ2 cualesquiera dos estimadores insesgados de . Se dice que ˆ1 es un
estimador más eficiente de que ˆ2, si V (ˆ1 ) V (ˆ2 ) , cumpliéndose la
desigualdad en el sentido estricto para algún valor de . El cociente
V(ˆ1 )
e=
V(ˆ2 )
se llama eficiencia relativa de ˆ1respecto a ˆ2, y su valor está entre 0 y 1
(0 e 1). Si e está próximo aˆ1 0 es mejor que ˆ2 .
Estimación puntual
Estimación puntual
Estimación de la Media Poblacional:
506 508 499 503 504 510 497 512 514 505 493 496 506 502
509 496
Solución:
1 16
X
16 i 1
xi 503.75
gramos.
Estimación puntual
Estimación de la Varianza Poblacional:
Cuando se desconoce la media poblacional , debemos sustituir este
parámetro por su estimador muestral, y el estimador a usar para la
varianza poblacional, que es centrado o insesgado sin importar cuál sea la
distribución de la población de interés, es la cuasivarianza muestral S 2.
2
n
n
n X i X i
2
̂ = S =
2 2
n
1 n
- 1
Xi X
2
i 1 i 1
n(n 1)
Demostración: i 1
2 2 4 2 2 4
V( S ) = con lo que lim n V( S ) = lim n =0 Es consistent e
n n
Estimación puntual
2 1 n
E[ S ] = E
2 1 n
( X i - X ) E 2
(X i - ) - ( X - ) =
(n - 1) i=1 (n - 1) i=1
1 n n n
= E ( xi - ) + ( X - ) - 2 ( xi - )( X - ) =
2 2
E[ S 2 ] = 2 c. q. d. Es centrado
Estimación puntual
Si hubiésemos utilizado como estimador, la varianza muestral (desconociendo
la media poblacional), no sería una estimación insesgada o centrada:
1
n
2 1 n 2
E[ ˆ ] = E ( xi - X ) E ( xi - ) - ( X - ) =
2
n i=1 n i 1
n n n
1
= E[ ( xi - ) + ( X - ) -2 ( xi - )( X - ) ] =
2 2
n i=1 i=1
n
1 n
xi
= E[ ( xi - )2+n( X - )2 - 2n( X - )( X - )] ya que X = i=1
n i=1
n
n
1
= E[ ( xi - )2-n( X - )2 ] =
n i=1
1 n 1
= [ E[( xi - )2 ] - n E[( X - )2 ]] =
n i=1 n
1 n )= 1 n 2 - = 2 -
2 2 2
= i
n i=1
E[( x - )
2
] -
n n
n
n
2 2
2
E[ ˆ ] = -2 No es centrado y su sesgo es
n n
Estimación puntual
Ejemplo:
5 3 34 18 27 14 8 50 38 43 35 20 70 25 60 19
Solución: 2
n
n
2 n xi xi
2
1 n
2
S X i X i 1 i 1 377.2958
n 1 i 1 nn 1
Estimación puntual
Estimación de la Proporción:
Tenemos una población dividida en dos subconjuntos, en función de una
característica determinada, de forma que la proporción de la población
que posee la característica es p, y la de los que no la poseen es 1-p.
Tratamos de estimar el valor de p. El estadístico p̂ dado por la expresión
siguiente, es un estimador centrado y consistente de la proporción
poblacional. casos favorables
pˆ
casos totales
Demostración:
1 n 1 1 1
E[pˆ ] = E xi = n E[ xi ] = p c. q. d. Es centrado E[pˆ ] = E[X] = n p = p con la binomial
n i=1 n n n
1 n 1 n 1 p(1 - p)
V(pˆ ) = 2 V xi = 2 V( xi )= 2 n p (1 - p) =
n i=1 n i=1 n n
X 1 p(1 - p) p(1 - p)
V(pˆ ) = V = 2 n p (1 - p) = con la binomial lim n = 0 c. q. d. Es consistent e
n
n n n
Estimación puntual
Ejemplo:
Solución:
415
p 0.83
500
Estimación por intervalos
Una estimación por intervalo de un parámetro poblacional es un intervalo de
la forma L1 < < L2, donde L1 y L2 dependen del valor del estadístico ˆ para
una muestra particular y también de la distribución muestral de ˆ. Un intervalo
de confianza al nivel de confianza (1-) 100% (donde 0 < < 1) para el
parámetro poblacional , a partir de una muestra seleccionada, es un intervalo
aleatorio tal que:
P (L1 < < L2) = 1 -
El intervalo de estimación indica, por su longitud, la precisión de la estimación
puntual. El intervalo L1 < < L2, que se calcula a partir de la muestra
seleccionada, se denomina entonces intervalo de confianza del (1 - ) 100%, la
fracción (1- ) recibe el nombre de coeficiente de confianza o grado de
confianza, y los puntos extremos L1 y L2, se llaman límites de confianza inferior
y superior.
ˆ
Ya que muestras distintas generalmente dan valores distintos de y, por tanto,
de L1 y L2, estos puntos extremos del intervalo son los valores de las variables
aleatorias correspondientes L1 y L2.
Estimación por intervalos
A partir de la distribución muestral de será posible determinar L 1 y L2 tales
que P(L1 < < L2) sea igual para cualquier valor fraccional positivo que se
desee especificar. Si, por ejemplo, se encuentran L1 y L2 tales que,
P (L1 < < L2) = 1 -
para 0 < < 1, entonces se tiene una probabilidad de (1- ) de seleccionar
una muestra aleatoria que produzca un intervalo que contenga a .
donde si x1, x2, ..., xn es una m.a.s. de una población de media y varianza
2 conocida 2
X-
X N( , )
Z= N(0,1)
n
n
Estimación por intervalos
P - z < Z < z = 1 -
2 2
P - z <
2
X
-
< z = 1 -
2
n
P - z < X - < z = 1 - P - z - X < - < z - X = 1 -
2 n 2 n 2 n 2 n
P - z + X > > z + X = 1 - P X - z < < X + z = 1 -
2 n 2 n 2 n 2 n
Por tanto:
Si X es la media de una m.a.s. de tamaño n de una población, aproximadamente
normal, con varianza conocida 2, el intervalo de confianza de (1 - ) 100% para
la media poblacional es :
X - z < < X + z
2 n 2 n
donde z/2 es el valor de z a la derecha del cual se tiene un área de /2
Estimación por intervalos
Ejemplo:
Los datos siguientes representan los pesos en gramos del contenido de 16
cajas de cereal que se seleccionaron al azar de un proceso de llenado con el
propósito de verificar el peso promedio.
506 508 499 503 504 510 497 512 514 505 493 496 506 502
509 496
Si el peso de cada caja de cereal es una v. a. normal con una desviación
típica = 5 gr., obtener el intervalo de confianza estimado del 95% para la
media de llenado de este proceso.
Solución:
Para el coeficiente de confianza de 95%, =0.05. El valor de z0.025 se
obtiene de la tabla normal y es de 1.96, ya que P(z >1.96) = 0.025. A partir
de los datos muestrales, se obtiene que:
gramos. 1 16
X xi 503.75
16 i 1
Estimación por intervalos
Entonces, el intervalo de confianza al 95% para la media del proceso de
llenado es:
5
L1= x z = 503.75 - 1.96 * = 501.3
2 n 16
5
L2= x z 2 = 503.75 + 1.96 * = 506.2
n 16
S S
X - t < < X + t
2 n 2 n
donde t/2 es el valor t con (n-1) grados de libertad, lo que deja un área de /2 a
la derecha.
Estimación por intervalos
Ejemplo:
Los contenidos de 7 recipientes similares de ácido sulfúrico son: 9.8, 10.2,
10.4, 9.8, 10, 10.2, 9.6 litros. Encuentre un intervalo de confianza del 95%
para la media de todos los recipientes, suponiendo una distribución
aproximadamente normal.
Solución:
La media muestral y su desviación estándar para los datos que se dan son:
X = 10 S=0.283
t0.025 = 2.447 para 6 grados de libertad.
Muestras
Muestras grandes
pequeñas
Estimación por intervalos
Varianzas conocidas (12 Y 22) Z=
( X 1 - X 2 ) - ( 1 - 2 )
2 2
La variable normal estándar. 1 +2
n1 n2
caerá entre -z/2 y z/2 con una probabilidad (1 - ).
P(-z/2 < Z < z/2) = 1 -
sustituyendo Z por la expresión anterior y siguiendo los mismos pasos
queXen casos anteriores, obtenemos:
1 X
Si y 2 son las medias de muestras aleatorias independientes de
tamaños n1 y n2 de poblaciones aproximadamente normales, con
varianzas conocidas 12 y 22 respectivamente, un intervalo de confianza
de (1 - ) 100% para 1 - 2 es:
2 2 2 2
( X 1 - X 2 ) - z 1
+ 2
< 1 - 2 < ( X 1 - X 2 ) + z 1
+ 2
2 n1 n2 2 n1 n2
donde Sp es 2 ( n1 - 1) S 12 + ( n2 - 1) S 2 2
Sp =
n1 + n2 - 2
L2 = x
1
x 2 t Sp
2
1
1
n1 n2
= 1.99 + 2.101*0.5607= 3.168
Calcule el intervalo de confianza del 90% para la diferencia entre los tiempos
promedio de duración de las películas que producen las dos compañías.
Suponga que el tiempo de duración tiene una distribución aproximadamente
normal.
Solución:
n1 = 5 t0.05,7 = 1.833
n2 = 7 = 98.4 -x1110.7
x 2 = -12.31
(1-)100% = 90% = 0.10 /2 = 0.05
1
s12= 4 (21.16+19.36+134.56+129.96+0.16)=76.3
1
s =
2
2 4 (188.08+824.51+151.94+350.22+4132.65+515.94+53.08)=1036.07
Estimación por intervalos
2
s12 s2 2 76 . 3 1036 . 07
2
n n
15.26 148.01
2
26657.09
1 2 5 7
v 2 2
2 2
7.186 7
s12 s2 2 76.3 1036.07 58.217 3651.16 3709.38
n n 5 7
1 2
n1 1 n2 1 4 6
2 2
L1= x1 x 2 t 2
s1 s
2 = -12.314 - 1.833*12.78= -35.74
n1 n2
2 2
L2= x1 x 2 t 2
s1 s
2 = -12.314 + 1.833*12.78= 11.11
n1 n2
d = +
n1 n2
Nivel de calcio
Parcela Antes Después Diferencia
1 50 9 41
2 50 18 32
3 82 45 37
4 64 18 46
5 82 18 64
6 73 9 64
7 77 32 45
8 54 9 45
9 23 18 5
10 45 9 36
11 36 9 27
12 54 9 45
Estimación por intervalos
Solución:
d = 40.583
Sd =15.79
Sd 15.79
L1= d - t/2 n= 40.583 - 2.201* 12 = 30.5504
Sd 15.79
d
L2 = + t/2 n = 40.583 + 2.201* 12 = 50.616
Estimación por intervalos
Estimación de la proporción:
Un estimador puntual de la proporción p en un experimento binomial está
dado por el estadístico p̂ = X/n donde X representa el nº de éxitos en n intentos
y sigue una distribución binomial de parámetros n y p.
1 p n
xi = X = xi B(n, p)
0 (1 p ) i=1
X
y p̂ = es justo la media muestral de estos n valores.
n
Por el Teorema del Límite Central, para una n lo bastante grande, p̂ está
distribuida aproximadamente en forma normal, con media:
X np
pˆ = E[pˆ ] = E = = p
n n
y varianza:
X 2X n p q p q p (1 - p)
= = 2 = 2 = =
2 2
pˆ
n
n n n n
Estimación por intervalos
Si p no es cercano a 0 ni a 1 y n grande, X N (np, npq)
X
-p
X -n p n
N(0,1) y por tanto N(0,1) para n grande
n pq p(1 - p)
n
Se puede asegurar que: P(- z 2 < z < z 2 ) = 1 -
X
donde -p
pˆ - p n
z= = N(0,1)
pq p (1 - p)
n n
Por tanto los extremos del intervalo de confianza que obtenemos, dependerían
del parámetro desconocido. ¿Cómo solucionarlo?
p (1 - p) X p (1 - p)
L1 = pˆ - z 2 = -z
n n 2 n
p (1 - p) X p (1 - p)
L2 = pˆ + z = z
2 n n 2 n
Solución:
pˆ 1 pˆ 0.83 * (1 0.83)
L1 pˆ z 0.83 1.96 0.83 3.2926 * 10 2 0.7971
2 n 500
pˆ 1 pˆ 0.83 * (1 0.83)
L2 pˆ z 0.83 1.96 0.83 3.2926 *10 2 0.8629
2 n 500
Estimación por intervalos
Estimación de Diferencia de Proporciones:
Deseamos estimar la diferencia entre dos parámetros binomiales p1 y p2. Para
establecer un intervalo de confianza para p1-p2 consideraremos la distribución
pˆ pˆ 2
muestral de 1
ˆ = X 1 y ˆestán
= X 2 distribuidos cada uno en forma
p1 p2
aproximadamente normal, con medias p1 y p2 y varianzas
n1 n2 p (1 - p ) p (1 - p )
1 1
y 2 2
pˆ 1- pˆ 2 = p1 - p 2
y varianza:
p1 (1 - p1 ) p 2 (1 - p 2 )
pˆ 1- pˆ 2 = +
2
n1 n2
Estimación por intervalos
Por tanto se puede asegurar que P(- z 2 < z < z 2 ) = 1 -
donde Z = ( pˆ 1 - pˆ 2 ) - ( p1 - p 2 )
p1 (1 - p1 ) p 2 (1 - p 2 )
+
n1 n2
Siguiendo todos los mismos pasos que en los demás casos, obtenemos:
Solución:
Con la información suministrada podemos calcular:
pˆ 1 1 pˆ 1 pˆ 2 1 pˆ 2 0.82 * 0.18 0.77 * 0.23
0.03436
n1 n2 250 300
Además sabemos que 1- = 0.90 = 0.1 /2 = 0.05 z0.05 = 1.645
pˆ 1 1 pˆ 1 pˆ 2 1 pˆ 2
L1 p1 p 2 z
ˆ ˆ 0.05 1.645 * 0.03436 0.00653
2 n1 n2
pˆ 1 1 pˆ 1 pˆ 2 1 pˆ 2
L2 pˆ 1 pˆ 2 z 0.05 1.645 * 0.03436 0.10653
2 n1 n2
Estimación por intervalos
Estimación de la Varianza:
Si se toma una muestra de tamaño n de una población normal con varianza 2
y se calcula la cuasivarianza muestral S2, esta varianza calculada se puede
utilizar como estimación puntual de 2. Para establecer una estimación de
intervalo de 2 se utiliza el estadístico
2
2
(n - 1) S
= 2
que, como ya sabemos, sigue una distribución 2 con (n-1) grados de libertad
cuando las muestras se seleccionan de una población normal. Siguiendo todos
los mismos pasos que en casos anteriores, obtenemos:
2 2 2 2 (n - 1) S 2 2
P < < = 1 - P < 2
<
= 1-
2 1
2 21
2
2
2
1 1 (n - 1) S 2
(n - 1) S 2
P 2
< < 2
= 1 - P 2
<
2
< 2 = 1-
(n - 1) 2
S
2
(n - 1) 2
S
1
2 2
Estimación por intervalos
Si s2 es la cuasivarianza de una muestra aleatoria de tamaño n de una población
normal, un intervalo de confianza del (1-)100% para 2 es:
(n - 1) s 2 (n - 1) s 2
2
< <
2
2
1-
2 2
donde 2/2 y 21 - /2 son valores de una distribución 2 con (n-1) grados de
libertad, con áreas de /2 y 1- /2 a la derecha, respectivamente.
2 2
1 n
xi 19407
2
S xi
n 1 i 1
i 1 i 1
n n 1
377.2958 i 1
16
L1
n 1S 2
15 * 377.2958
226.41 L2
n 1S 2
15 * 377.2958
779.43
2 0.05,15 24.996 2 0.95,15 7.261
donde f/2 (v1,v2) es el valor f con v1 = (n1 -1) y v2= (n2-1) grados de libertad con un
área de /2 a la derecha, y f/2 (v2,v1) es un valor similar f con v2= (n2-1) y v1=(n1-1)
grados de libertad.
Solución:
n1 = 5 n2 = 7
1- = 0.90 = 0.1 /2 = 0.05
1 1 1
0f.0.05
221 = 6.16
f v1,v 2 f0.05 4,6 4.53 (6,4)
2
Solución:
Si suponemos que tenemos una buena estimación previa de p:
13
pˆ = = 0.9286
14
(1 - )100% = 99% = 0.01 z = 2.58
2
= 0.02
( z )2 pˆ (1 - pˆ ) (2.28 )2 (0.9286)(0 .0714)
2
n= = = 1103.33 1104
2
(0.02 )2
Tamaño de la muestra
Si lo hacemos sin considerar la estimación previa de p, sino considerando el
máximo:
( z )2 (2.58 )2
n= 2
= 2
= 4160.25 4161
42 4 (0.02 )
Se pide:
a) Construir un intervalo de confianza del 95% para la diferencia de
vida media de cada tipo de esquema.
b) Construir un intervalo de confianza del 90% para el cociente de
varianzas de la vida de cada tipo de esquema.
Ejercicios
Ejercicio 6.2
Una agencia de alquiler de automóviles necesita estimar el número
medio de kilómetros diarios que realiza su flota de automóviles; a tal
fin, en varios días de la semana toma los recorridos de 100 vehículos de
su flota y obtiene que la media muestral es de 165 Km/día, y la
cuasidesviación típica muestral de 6 Km/día. Se pide:
a) Bajo la hipótesis de normalidad de la característica de estudio (nº de
km por día), construir un intervalo de confianza para la media de dicha
distribución a un nivel de confianza del 95%.
b) Bajo la misma hipótesis de normalidad que en a), construir un
intervalo de confianza del 90% para la varianza de dicha distribución.
Ejercicios
Ejercicio 6.3
En un cruce de Melanogaster se han obtenido 60 moscas con alas
vestigiales de un total de 300. Se pide:
a) Encontrar un intervalo de confianza al 95% para la proporción de
moscas con alas vestigiales entre los individuos resultantes de un gran
número de cruces como este.
b) Qué número de cruces hay que realizar de modo que la proporción de
moscas con alas vestigiales entre los individuos resultantes de un gran
número de cruces y la de la muestra difiera en valor absoluto en menos
de 0.01 con una probabilidad del 95%?