Documentos de Académico
Documentos de Profesional
Documentos de Cultura
6 Estimacion de Parametros
6 Estimacion de Parametros
ESTIMACIN DE PARAMETROS
6.1. INTRODUCCIN
A la inferencia estadstica le interesa sacar conclusiones de un gran nmero de
acontecimientos (poblacin), fundndose en las observaciones de una parte de los mismos
(muestra).
Los estadsticos, valores obtenidos en la muestra, son, pues, estimadores de los parmetros
correspondientes (valores de la poblacin)
6.2. CARACTERISTICAS DE UN BUEN ESTIMADOR
CARENCIA DE SESGO.
Un estimador (estadstico) carece de sesgo si el promedio (media) de todos los valores posibles
de todas las muestras posibles de tamao n de una poblacin es igual al parmetro, es decir, si
la media de la distribucin muestral del estadstico considerado es igual al valor del parmetro.
As, la media es un estimador insesgado de porque se puede demostrar que la media
aritmtica de una distribucin muestral coincide con el valor del parmetro, algo que no puede
decirse de r, por ejemplo, o de la varianza (s2) o de la mediana de una poblacin no distribuida
normalmente.
CONSISTENCIA
Un estimador es consistente en la medida en que, al aumentar el tamao de la muestra, - n su valor se acerca cada vez ms al parmetro correspondiente o lo que es lo mismo, si a
medida que aumenta el tamao de la muestra, las estimaciones que sta proporciona son cada
vez ms prximas al valor del parmetro.
Algunos estimadores sesgados son consistentes, acercndose cada vez ms sus valores a los de
sus respectivos parmetros a medida que el tamao de la muestra (n) aumenta, tal es el caso
de s o s2 que son estimadores sesgados pero consistentes de la desviacin tpica () o de la
varianza (2) de la poblacin.
EFICIENCIA
2
Eficiencia relativa =
n
1,57
1
= 0,637 63,7%
1,57
2
x
(X
=
1
Estimadores sesgados: s
2
x
(X
=
, sx, rxy0
s x , s x2
Q1 + Q3
[son estimadores insesgados
2
de ]
Estimadores sesgados y no eficientes: y desviacin tpica modificada (
2
s ) y rango
1
semiintercuartlico
6.3.1. METODOS
En este apartado vamos a dar dos mtodos sencillos y razonables para construir estimadores
que puedan aplicarse en cualquier situacin que nos encontremos: el mtodo de los
momentos y el mtodo de mxima verosimilitud.
Definicin: Sea ( X1, X 2 ,..., X n ) una muestra aleatoria simple de una poblacin X con funcin
de masa P , o de densidad f , donde = (1 ,2 ,...,k ) es el vector paramtrico a estimar. El
estimador de por el mtodo de los momentos es el formado por los valores 1 ,2 ,...,k
obtenidos al resolver el siguiente sistema de ecuaciones:
E[ X ] = 1 n X i
n i=1
.........................
k = n de parmetros a estimar
1
E[ X k ] =
n X ik
n i=1
La justificacin de este mtodo es muy sencilla: se basa en la intuicin de que los momentos
de la poblacin se parecern a los momentos de la muestra.
Hay que sealar, no obstante, que el mtodo presenta serios inconvenientes ya que puede
darse el caso de que la estimacin obtenida quede fuera del espacio paramtrico (campo de
definicin del parmetro).
Definicin: Sea ( X1, X 2 ,..., X n ) una muestra aleatoria simple de una poblacin X con funcin
de masa P , o de densidad f , donde = (1 ,2 ,...,k ) es el vector paramtrico a estimar. El
estimador de por el mtodo de mxima verosimilitud es el formado por los valores 1 ,2
,...,k que maximizan la llamada funcin de verosimilitud de la muestra (x1, x2 ,..., xn ) obtenida:
(caso discreto)
k = n de parmetros a estimar
log L() = 0
k
Por supuesto, hay que tener cuidado con este procedimiento, ya que el punto obtenido puede
no corresponder con un mximo (puede ser un mnimo o punto de inflexin). Adems puede
ocurrir que el mximo se alcance en un extremo, y no obtengamos ningn beneficio de este
procedimiento.
Ejemplo: Sea una muestra aleatoria de tamao n de una poblacin X con distribucin de
Bernoulli de parmetro p. Encontramos el estimador p del parmetro p.
En este caso la funcin de masa es P(x) = p x (1 p)1x
Estimador por el mtodo de los momentos:
E[ X ] = p , como 1 n xi = x , tomamos como estimador del parmetro p el n i=1
valor de la media muestral p = x .
Estimador por el mtodo de la mxima verosimilitud:
L( p) = P(x1 ).P(x2 )....P(xn ) =
x
=p
n xi
log L( p) = xi
= 0 (sistema a resolver)
p
1 p
n
x i
p
1p 1p
=0
( 1p +1 1 p )xi = 1 n p
1 p+ p xi
p(1
p)
=n
1
x
pi
p = x
f ( x; ) donde
es el parmetro desconocido.
f ( x1 , x2 , ..., xn ; ) = f ( x1 ; ) f ( x2 ; ) ... f ( xn ; )
Si consideramos
Sean
recibe el
De todos ellos pretendemos elegir el que haga mxima la funcin de verosimilitud. Es decir, un
estimador
si maximiza V( ).
d ( ln V ( ) )
=0
d
siguientes:
d ( ln V ( 1 , 2 , 3 ) )
= 0
d 1
^
d ( ln V ( 1 , 2 , 3 ) )
= 0
d 2
d ( ln V ( 1 , 2 , 3 ) )
= 0
d 3
a) Son consistentes.
c) Si
es funcin de
Ejemplo: Obtener el EMV del parmetro de una v.a. X que sigue una distribucin de Bernouilli,
x1
V ( p) = f ( x1 ; p ) f ( x2 ; p ) . .. f ( xn ; p ) = p (1 p)
1 x1
x2
p ( 1 p)
1 x 2
xn
. .. p (1 p )
x
n
x
= p (1 p )
i
ln V ( p) =
x ln p + (n x ) ln (1 p)
i
d ( ln V ( p ) )
=0
dp
En este caso
d ( ln V ( p ) )
=
dp
1
+ (n
p
( 1)
x ) (1 p) = 0
i
(1 p ) xi p( n
x ) = x
i
x = x
np + p
p =
np = 0
6.3.1.2. MOMENTOS
Consiste en tomar como estimadores de los momentos poblacionales a los momentos
muestrales. Se obtiene una ecuacin de donde podemos despejar el parmetro a estimar.
1 x n
y varianza
2 . Se cumple que:
k
k
1
X + 1 2
X
n
, Xn
1
k
Para analizar los resultados que presentamos a continuacin, supongamos una poblacin que
se distribuye normal de media
2
y varianza poblacional . Tambin servirn cuando la
a) Si
es conocida.
Xn
N( 0,1) . Sea z el percentil de la distribucin normal; es
1
2
n
decir, ( z) = 1
.
2
Ya sabemos que
Xn
P z
z = 1
2
2
n
Haciendo operaciones
P Xn z
Xn z1
b) Si
, Xn + z
Xn + z
= 1
n
ser:
es desconocida.
Xn
sn
n 1 t n 1
tn 1 al percentil de la distribucin t de
1
P(tn 1 x) = 1
Xn tn 1
sn
, Xn + t n 1
n1
sn
n 1
1 = 0' 99 = 0' 01 1
= 0' 995
2
Xn tn 1
sn
, Xn + t n 1
n1
sn
n 1
t6 0
0 ,9 9 5
Sabemos que
= 2' 66 .
10
10
80
2
'
66
,
80
+
2
'
66
60
60
por tanto,
N p,
pq
y
n
varianza conocida visto anteriormente, sustituyendo lo anterior y aproximando p(1-p) por P(1P). un intervalo de confianza aproximado para p a nivel 1 sera:
P z1
P(1 P )
,P+ z
1
n
2
P(1 P )
Ejemplo: Uno de los lderes de un colectivo laboral desea plantear una cuestin a todos los
miembros del grupo. Si ms de la mitad respondieran NO entonces preferira no plantearla
para no minar su prestigio. Para salir de dudas, elige aleatoriamente a 100 trabajadores a los
que hace la pregunta y slo 30 responden NO. Entre qu lmites se hallar la verdadera
proporcin al nivel del 95%?
Como el tamao muestral es grande, podemos aplicar el teorema central del lmite. Tenemos
1 = 0' 95 1
0' 3 1' 96
0' 3 0' 7
0' 3 0' 7
= [0' 2102 , 0' 3898 ]
, 0' 3 + 1' 96
100
100
Sean
P1 P2 N p1 p2 ,
p1 q1 p2 q2
+
y desconocemos los valores de p1 y p2 ,
n1
n2
p1 p2 P1 P2 z
1
Var [ P1 P2 ] = pq
n1
P1 Q1 P2 Q2
+
, P1 P2 + z
1
n1
n2
2
P1 Q1 P2 Q2
+
n1
n2
p1 = p2 = p, entonces E[P1 P2 ] = 0 y
+
1
n1 P1 + n2 P2
. Lo que haremos es sustituir p por
n1 + n2
n2
Ejemplo: En dos grandes empresas se lleva a cabo un estudio sobre la proporcin de mujeres
entre sus empleados diplomados y licenciados. De cada empresa se toma una m.a.s. de 40
empleados entre los diplomados y licenciados, obtenindose que en la empresa A haba 16
mujeres y en la empresa B, 22 mujeres. Obtener el intervalo de confianza para la diferencia de
proporciones poblacionales al nivel de confianza 0'96 Podemos pensar que la proporcin es la
misma?
1 = 0' 96 1
P1 =
16
= 0' 4
40
= 0' 98 z = 2' 05
1
2
2
P2 =
22
= 0' 55
40
Sustituyendo en el intervalo:
0' 4 0' 6
40
0' 55 0' 45
40
0' 4 0' 6
40
0' 55 0' 45
40
( n 1) sn21
n2 1
(n 1)sn21
P 2n 1
2n 1 = 1
2
1
2
2
Despejando 2 tenemos:
(n 1) s 2
(n 1) sn21
2
n
1
=1
P
n21
n21
2
2
Es decir,
(n 1)sn21 (n 1)sn21
,
2
n 1
2n1
1
2
2
2
Ejemplo: De acuerdo con las tablas de altura, los varones tienen una altura superior a las
mujeres en la poblacin espaola. Segn las ltimas tablas en el servicio militar, los varones
entre 18 y 20 aos presentan una varianza de 0'0529. de las mujeres no tenemos informacin,
por ello tomamos una muestra de 101 mujeres entre 18 y 20 aos y obtenemos sn 1 = 0'18
Entre qu valores se encontrar la verdadera varianza a un nivel de 0'95 de confianza?
1 = 0'95 1
2
= 0'975 100
= 74'22
0 ' 025
= [0'025,0'0436]
74
'
22
129
'
56
s n21
s m2 1
12
22
Fn 1,m 1
12
22
s n21
s n21
1
1
, 2
2
s m1 Fn 1,m 1 s m 1 Fn 1,m 1
1
2
2
Ejemplo: Con los datos del ejemplo de la pag. 11 , calcular el intervalo de confianza para el
cociente de varianzas al nivel de confianza 0'95. Podramos aceptar la suposicin de que las
varianzas poblacionales son iguales?
1 = 0'95 1
s n21 =
1
F30,300 '975
n 2 31 2
s n = 2'3 = 5'47
n 1
30
1
2'07
s m2 1 =
m 2 31 2
s m = 3 = 9'3
m 1
30
5'47 1 5'47
1
,
9'3 2'07 9'3 1 2'07 = [0'284,1'218]
El intervalo contiene al 1 y los extremos estn bastante prximos al 1. Hay mayor diferencia
por el extremo inferior, lo que indica que la varianza de la poblacin X es menor que la de la
poblacin Y.
6.10 DETERMINACIN DEL TAMAO DE LA MUESTRA
En general, cuanto ms estrecho es un intervalo de confianza mayor precisin tendr nuestra
estimacin (ser menor el error muestral mximo). Ahora bien, la amplitud de un intervalo
depende de dos factores: el nivel de confianza que decidimos utilizar y el tamao del error
tpico (es la desviacin tpica) del estadstico utilizado como estimador.
Para la media:
E=z
E = t n 1
n = z
1 E
n
2
s
n = t n 1 n 1
1 E
n
s n 1
Para la proporcin:
E=z
PQ
n=
n
PQz 2
1
Ejemplo: Queremos estimar la media de una poblacin normal con varianza poblacional igual a
4. qu tamao muestral debemos tomar para que E=0'02 al nivel de confianza 0'95?
1 = 0'95 = 0'05 1
= 1'96
n= z
= (196) 2 = 38416
1 E
0'02
2
Comparacin de medias
Grupos independientes
Grupos emparejados
BIBLIOGRAFIA
http://www.eumed.net/libros/2006a/rmss/a8.htm
Devore, J.L. (2000). Probabilidad y Estadstica para Ingeniera y Ciencias, Quinta
Edicin, Thomson Learning.
Mendenhall, W. (1998). Estadstica para Administradores, Segunda Edicin,
Grupo Editorial Iberoamrica.
Montgomery, D.C. y Runger G.C. (1996). Probabilidad y Estadstica Aplicadas a
la Ingeniera, Primera Edicin, Mc Graw Hill.
Sheaffer, R. L. y McClave, J.T. (1990). Probabilidad y Estadstica para Ingeniera,
Primera Edicin, Grupo Editorial Iberoamrica.
Spiegel, M.R. (1970). Estadstica, Primera Edicin, Serie Schaum, Mc Graw Hill.
Walpole, R. E., Myers, R.H., y Myers, S.L. (1998). Probabilidad y Estadstica para
Ingenieros, Sexta Edicin, Prentice Hall.
Weimer, R.C. (1996). Estadstica, Segunda Edicin, CECSA.
1.- En dos grandes empresas se lleva a cabo un estudio sobre la proporcin de mujeres
entre sus empleados diplomados y licenciados. De cada empresa se toma una m.a.s. de
40 empleados entre los diplomados y licenciados, obtenindose que en la empresa A
haba 16 mujeres y en la empresa B, 22 mujeres. Obtener el intervalo de confianza para la
diferencia de proporciones poblacionales al nivel de confianza 0'96 Podemos pensar que
la proporcin es la misma?
2.- La siguiente tabla presenta los resultados de dos muestras aleatorias para comparar el
contenido de nicotina de dos marcas de cigarrillos.