Estim Adores

Gestión
Aeronáutica: Estadística Teórica
Facultad Ciencias Económicas y Empresariales
Departamento de Economía Aplicada
Profesor: Santiago de la Fuente Fernández
ESTADÍSTICA TEÓRICA: ESTIMADORES
Estadística Teórica: Estimadores 1

Gestión Aeronáutica: Estadística Teórica
Facultad Ciencias Económicas y Empresariales
Departamento de Economía Aplicada
Profesor: Santiago de la Fuente Fernández
ESTIMADORES
Un estimador es un estadístico (una función de la muestra) utilizado para
estimar un parámetro desconocido de la población.
Por ejemplo, si se desea conocer el precio medio poblacional de un
artículo (parámetro desconocido) se recogen observaciones del precio de
dicho artículo en diversos establecimientos (muestra) pudiendo utilizarse
la media aritmética de las observaciones para estimar el precio medio
poblacional.
Para cada parámetro pueden existir varios estimadores diferentes. En
general, se elige el estimador que posea mejores propiedades que los
restantes, como insesgadez, eficiencia, convergencia y robustez
(consistencia).
El valor de un estimador proporciona una estimación puntual del valor del
parámetro en estudio. En general, se realiza la estimación mediante un
intervalo, es decir, se obtiene un intervalo
 estadístico muestral  error estimación dentro del cual se espera se
encuentre el valor poblacional dentro de un cierto nivel de confianza. El
nivel de confianza es la probabilidad de que a priori el valor poblacional
se encuentre contenido en el intervalo.
PROPIEDADES DE LA ESPERANZA Y VARIANZA
a) EaX1  bX 2   EaX1   EbX 2   a E X1   b E X 2 
b) Var aX1  bX2   Var aX1   Var bX2   a2 Var  X1   b2 Var  X 2 

SESGO
Se denomina sesgo de un estimador a la diferencia entre la esperanza
(valor esperado) del estimador y el verdadero valor del parámetro a
estimar. Es deseable que un estimador sea insesgado o centrado, esto es,
que el sesgo sea nulo para que la esperanza del estimador sea igual al
valor del parámetro que se desea estimar.
Por ejemplo, si se desea estimar la media de una población, la media
aritmética de la muestra es un estimador insesgado de la misma, ya que
la esperanza (valor esperado) es igual a la media poblacional.
Si una muestra X  (x 1 , x 2 ,  , x n ) procede de una población de media  :
E x i    para i  (1, 2,  , n)
 La media aritmética muestral es un estimador insesgado de la media
poblacional:
1 n  1  n  1 n
    E x 1   E x 2     E x n   
1
E x   E  xi   E  xi   E x i  
 n i  1  n  i  1  n i1
n
1
 n   
n
 La varianza de una muestra aleatoria simple es un estimador sesgado
de la varianza poblacional, siendo su esperanza:
n

i1
(x i  x)2
La varianza muestral   2
x . Para calcular su esperanza
n
matemática se realizan previamente algunos cálculos sumando y restando
la esperanza de la variable aleatoria poblacional.
n n
 (x  x)  (x  x    )
i
2
i
2
n
(xi  )  (x  )
i1 i1 1 2
 2x   
n n n i1
Desarrollando el cuadrado:

n

1
 
2
x
(x i  )2  (x  )2  2(x i  )(x  ) 
n i1
1 
n n
 
n


i1
(x i  )2  n(x  )2  2(x  ) i1
(x i  )  


1 
n
 
n


i 1
(x i  )  n(x  )  2 (x  ) (n x  n )  
2 2


1 
n
 
n


i1
(x i  )  n x  n   2n x   2n x  2n x   2n x   2n   
2 2 2


2 2
1 
n
 
n


i1
(x i  )  n(x  ) 
2


2
Calculando la esperanza matemática de la varianza muestral  2x :
1   1 n
n
E     E 
2
x
n 


i1
(x i  )  n(x  )  
2
 n i1
 
2

E  (x i  )2   E  (x  )2 

  varianza media
varianza poblacional muestral
En el segundo miembro aparecen dos esperanzas, la primera E(x i  )2

coincide con la varianza poblacional  2 al tratarse de una muestra
aleatoria simple, la segunda esperanza E(x  )2 es la varianza de la media
2
muestral
n
2 n  1 2
Por tanto, E      
2
x   2
n n
 La cuasivarianza de una muestra aleatoria simple es un estimador
n
 (x  x)
i1
i
2
insesgado de la varianza poblacional: s2x 
n1

Relación entre varianza y cuasivarianza:
n
n  2x  (n  1) s2x  s2x   2x
n1
La esperanza de la cuasivarianza s2x es la varianza poblacional  2 :
 n  n n n1 2
E  s2x   E   2x   . E   2x   . .   2
n  1  n  1 n1 n
 Un estimador ̂ es insesgado (centrado) cuando E(ˆ )  
 Un estimador ̂ es sesgado sí E(ˆ )    b(ˆ )  b(ˆ )  E(ˆ )  


sesgo
 Un estimador ̂ es asintóticamente insesgado si su posible sesgo
tiende a cero al aumentar el tamaño muestral que se calcula: lim b(ˆ )  0
n 
n
x
1
Sea el estimador ˆ 
n1
i
i1
 1 n   n  n
n
  
1 1 1
ˆ
E()  E  xi  E xi  E(x i )  (n ) 
 n  1 i1  n  1  i  1  n  1 i1
n1 n1
n n  n    n  
b(ˆ )  E(ˆ )        0
n1 n1 n1

insesgado
asintóticamente

ERROR CUADRÁTICO MEDIO DE LOS ESTIMADORES (ECM)
La utilización de la estimación puntual como si fuera el verdadero valor
del parámetro conduce a que se pueda cometer un error más o menos
grande.
El Error Cuadrático Medio (ECM) de un estimador ̂ viene definido:
2
 
ECM()  E(  )  V()  E( )    sesgo b(ˆ )  E(ˆ )  
ˆ ˆ 2 ˆ ˆ
 
 sesgo 
Cuando el estimador es centrado, el sesgo b(ˆ )  0  ECM(ˆ )  V(ˆ )
Un error cuadrático medio pequeño indicará que en media el estimador ̂
no se encuentra lejos del parámetro .
CONSISTENCIA
Si no es posible emplear estimadores de mínima varianza, el requisito
mínimo deseable para un estimador es que a medida que el tamaño de la
muestra crece, el valor del estimador tienda a ser el valor del parámetro
poblacional, propiedad que se denomina consistencia.
Un estimador ̂ consistente es un estimador asintóticamente insesgado
cuya varianza tiende a cero al aumentar el tamaño muestral.
El estimador ̂ es consistente cuando lim E(ˆ )   y lim V(ˆ )  0

n n
EFICIENCIA
Un estimador es más eficiente o más preciso que otro estimador, si la
varianza del primero es menor que la del segundo.
Sean ̂ 1 y ̂ 2 dos estimadores insesgados, se dice que ̂ 1 es más

eficiente que ̂ si se verifica que Var(ˆ )  Var(ˆ )
2 1 2
Var(ˆ 1 )
La eficiencia relativa se mide por la ratio:
Var(ˆ ) 2

La eficiencia de los estimadores está limitada por las características de la
distribución de probabilidad de la muestra de la que proceden.
 Es insesgado
Un estimador es eficiente cuando verifica: 
Posee varianza mínima
La cuestión de tener varianza mínima queda resuelta mediante la Cota de
Cramér‐Rao.
La varianza de un estimador verifica siempre la Cota de Cramér‐Rao:
V(ˆ )  CCR . Un estimador será eficiente cuando V(ˆ )  CCR
2
1  b(ˆ )
ˆ
y la cota resulta V()  CCR  2
 ln L(x, ) 
nE  
  
1
Si el estimador es insesgado b(ˆ )  0 : V(ˆ )  CCR  2
 ln L(x, ) 
nE  
  
2
1  b(ˆ )
ˆ
En muestras aleatorias simples: V()  CCR  2
 ln L(x, ) 
nE  
  
Es preciso destacar que la Cota de Cramér‐Rao (CCR) no tiene por qué
tomar siempre un valor muy pequeño (cercano a cero).
Un estimador es asintóticamente eficiente sí: lim V(ˆ )  CCR

x 
El denominador de la Cota de Cramér‐Rao es la cantidad de información
de Fisher en una muestra:
2 2
  ln L(X , )    ln L(x , ) 
I()  E   o bien i()  E   donde I()  n.i()
     
A la función ln L(X , ) se llama soporte o Log‐verosimilitud.

La cantidad de información de Fisher I() puede simplificarse en una
muestra aleatoria simple (m.a.s.), según sea el caso discreto o continuo,
obteniendo la expresión:
   ln P(x 1 , x 2 ,  , x n ; ) 
2
  ln P(x ; ) 
2
 Discreto : E    n.E  
      


 2 2
 Continuo : E   ln f(x 1 , x 2 ,  , x n ; )   n.E   ln f(x ; ) 
    
      
MÉTODO DE MÁXIMA VEROSIMILITUD (EMV)
La estimación por máxima verosimilitud es un método de optimización
que supone que la distribución de probabilidad de las observaciones es
conocida.
Sea (x 1 ,  ,x n ) una muestra aleatoria (no necesariamente simple) de
una población X con función de masa P (o función de densidad f )
donde   ( 1 ,  ,  n ).
El estimador de máxima verosimilitud (probabilidad conjunta) de  es el
formado por los valores (ˆ 1 ,  , ˆ n ) que maximizan la función de
verosimilitud de la muestra (x 1 ,  ,x n ) obtenida:
P(x 1 , )  P(x n , ) caso discreto


L()  L(X; )  L(x 1 ,  ,x n ;  )  
 f (x )  f (x ) caso continuo
  1  n
En muchas ocasiones, es más práctico encontrar el estimador de máxima
verosimilitud es considerar la función soporte o Log‐verosimilitud
ln L(X , ) , en lugar de la función de verosimilitud L() , ya que es más fácil
de manejar y presenta los mismos máximos y mínimos.

 ln L()
Se despeja ˆ  (ˆ 1 ,  , ˆ n ) de la ecuación:  0 y se
 ˆ
obtiene el estimador de máxima verosimilitud E.M.V(ˆ )
SUFICIENCIA
Un estimador ̂ es suficiente cuando no da lugar a una pérdida de
información. Es decir, cuando la información basada en ̂ es tan buena
como la que hiciera uso de toda la muestra.
Para identificar estadísticos suficientes se utiliza el criterio de
factorización de Fisher‐Neyman, que dice que dada una muestra aleatoria
(x 1 ,  ,x n ) de una población X con función de masa P (o función de
densidad f ) un estadístico ̂ es suficiente para  si y sólo sí:
 Pθ (x 1 ,  ,x n )  g  θ(x ˆ 
1 ,  ,x n ), θ  . h(x 1 ,  ,x n ) caso discreto
 


 fθ (x 1 ,  ,x n )  g  θ(x 1 ,  ,x n ), θ  . h(x 1 ,  ,x n ) caso continuo
ˆ
Para encontrar un estadístico suficiente ̂ hay que factorizar la función de
ˆ θ) . h(x ,  ,x )
verosimilitud de la forma: L()  g (θ, 1 n

MÉTODO DE LOS MOMENTOS
El procedimiento consiste en igualar momentos poblacionales respecto al
origen  r a los correspondientes momentos muestrales respecto al
origen a r , formando así tantas ecuaciones como parámetros
poblacionales se pretenden estimar:
 n

   E(X)  
x i
 
ˆ 1  a1  i 1
x
 1 n
 n


  2  E(X 2 )
x 2
i
 
ˆ 2  a2  i 1
 n
   
 n


  r  E(X r )
x r
i
 
ˆ r  ar  i 1
 n

EJERCICIOS DE ESTIMADORES
 La variable aleatoria poblacional "renta de las familias" del municipio
de Madrid se distribuye siguiendo un modelo N( , ) . Se extraen
muestras aleatorias simples de tamaño 4. Como estimadores del
parámetro , se proponen los siguientes:
x 1  2x 2  3x 3 x3  4 x2
ˆ 1  ˆ 2  ˆ 3  x
6 3
Se pide:
a) Comprobar si los estimadores son insesgados
b) ¿Cuál es el más eficiente?
c) Si tuviera que escoger entre ellos, ¿cuál escogería?. Razone su
respuesta a partir del Error Cuadrático Medio.
Solución:
a) Un estimador ̂ es insesgado (o centrado) cuando se verifica E(ˆ )  
 x  2x 2  3x 3  1
E(ˆ 1 )  E  1   E x 1  2x 2  3x 3  
 6  6
1 1
  E(x 1 )  2E(x 2 )  3E(x 3 )    6    
6 6
 x  4 x2  1 1
E(ˆ 2 )  E  1    E x 1  4 x 2     E(x 1 )  4E(x 2 )  
 3  3 3
1
    3    
3
 x  x2  x3  x 4  1
E(ˆ 3 )  E  1   E x 1  x 2  x 3  x 4  
 4  4
1 1
  E(x 1 )  E(x 2 )  E(x 3 )  E(x 4 )    4    
4 4

Los tres estimadores son insesgados o centrados.
b) El estimador más eficiente es el que tenga menor varianza.
 x  2x 2  3x 3  1
V  ˆ 1   V  1  36 V  x 1  2x 2  3x 3  

 6 
1 1 14
  V(x1 )  4 V(x 2 )  9V(x 3 )    14  2    2  0,39  2
36 36 36
 x  4 x2  1 1
V  ˆ 2   V  1   V  x 1  4 x 2    V(x 1 )  16 V(x 2 )  
 3  9 9
1 17
  17  2    2  1,89  2
9 9
 x  x2  x3  x 4  1
V  ˆ 3   V  1  16 V  x 1  x 2  x 3  x 4  

 4 
1 1 4
  V(x 1 )  V(x 2 )  V(x 3 )  V(x 4 )    4  2    2  0,25  2
16 16 16
El estimador ̂ 3 es el más eficiente.
2
c) ECM(ˆ )  E(ˆ  ) 2  V(ˆ )  b(ˆ ) sesgo b(ˆ )   E(ˆ )   
Al ser los tres estimadores insesgados b(ˆ )  0  ECM(ˆ )  V(ˆ )

El error cuadrático medio coincide con la varianza, por tanto, se elige el
estimador ̂ 3 por presentar menor varianza.

 La variable aleatoria X representa los gastos mensuales de una
empresa, cuya función de densidad es f(, x)   x   1 con  0 y 0  x  1 .
Se realiza una m.a.s. de tamaño 3, y se proponen tres estimadores:
x 12  2x 22  3x 32 x  2x 1  4 x 2
ˆ 1  x ˆ 2  ˆ 3  3
6 6
a) Calcule los sesgos
b) Si la muestra que se obtiene es (0,7; 0,1; 0,3), calcule las estimaciones
puntuales
c) ¿Cuáles son las funciones estimadas para las estimaciones anteriores?
Solución:
a)
 x  x2  x3  1 1
 ˆ 1  x  E(ˆ 1 )  E  1  E 
 3  1 x  x 2  x 
3  (3 )  
 3  3
donde

   
1 1 1
1
 x f(x, ) dx  x f(x, ) dx  x x dx   x  dx 
 0 0 0
1
  x 1  
   
 10 1
   2
Sesgo: E(ˆ 1 )   b(ˆ 1 )  E(ˆ 1 )    
1 1 1
 x 12  2x 22  3x 23  1  
 E(ˆ 2 )  E     E(x
2
)  2E(x 2
)  3E(x 2
)   1 (6  )  
 6      6
1 2 3 2 2
 6

 2 
2

2
  
1 1
 2  E(x )  2
x f(x, ) dx 
2
x f(x, ) dx 
2
x 2  x   1 dx 
 0 0
1
  x 2  

1
 1
 x dx    
0  2 0 2

 
 x 12  2x 22  3x 23  1  2  
E(ˆ 2 )  E     E(x 1 )  2E(x 2 )  3E(x 3 )    2 
2 2
 6  6     2

 2 
2

2


 2  
 
Sesgo: b(ˆ 2 )  E ˆ 2 
2

2
 x  2x 1  4 x 2  1 1 1
 E(ˆ 3 )  E  3  E 
 6  3 x  2x 1  4 x 
2  (3  )  
 6  6 2

   
1 1 1
1
 x f(x, ) dx  x f(x, ) dx  x x dx   x  dx 
 0 0 0
1
  x 1  
   
 10 1
ˆ ˆ 1   2 2  
Sesgo: b(3 )  E(3 )     
2  1 2(  1)
b) Las estimaciones puntuales de la muestra (0,7 ; 0,1 ; 0,3):
0,7  0,1  0,3
ˆ 1   0,367
3
0,7 2
 2.0,1 2
 3.0,3 2
ˆ 2   0,13
6
0,3  2.0,7  4.0,1
ˆ 3  ˆ 0
  0,117  no puede ser, puesto que 
6
c) Las funciones estimadas para las estimaciones de la muestra:
ˆ 1  f(0,367, x)  0,367 x 0,367  1  0,367 x  0 ,633

ˆ 2  f(0,13, x)  0,13 x 0 ,13  1  0,367 x  0 ,87

 Sea una población con media  de la que se extraen m.a.s. de
tamaño n. Considere los siguientes estimadores de la media:
n
x
1
ˆ 1  x ˆ 2 
n1
i
i1
a) Estudiar la insesgadez, la eficiencia relativa y la consistencia de ambos
estimadores
b) Elegir uno de los dos en término del error cuadrático medio
Solución:
a) Insesgadez:
1 n
 1 1 n
 1 n
  
1
 E(1 )  E(x)  E 
ˆ xi   E xi   E(x i )  (n )  
n  n n  n n
 i1   i1  i1
Sesgo: b(ˆ 1 )  E(ˆ 1 )        0
 1 n  1 
n
 n
  E(x ) 
1
 E(ˆ 2 )  E  xi   E xi  
 n  1 i1  n  1   n1 i
   i1  i1
1 n
 (n ) 
n1 n1
 0 cuando n  

 
n n  n   
 b(ˆ 2 )  E(ˆ 2 )      
n1 n1 
n
 1
sesgado
asintoticamente
Eficiencia:
Sean dos estimadores insesgados ̂1 y ̂2 de un parámetro desconocido

 . Se dice ̂1 es más eficiente que ̂2 si se verifica:
ˆ ˆ Var (ˆ 1 )
Var(1 )  Var(2 ) . La eficiencia relativa se mide por la ratio
Var (ˆ 2 )
n n
2
 
1 1 1
V(ˆ 1 )  V(x)  V( x i)  2 V(x i )  2 (n  ) 
2
n i1
n i1
n n

 1 n
 n
 
1 1 n
V(ˆ 2 )  V  xi   V(x i )  (n  2
)   2
 n1  (n  1) 2 (n  1) 2 (n  1) 2
 i1  i1
Eficiencia relativa:
Var(ˆ 1 ) 2 n (n  1) 2
   1  Var(ˆ 1 )  Var(ˆ 2 )
Var( 2 )
ˆ n  (n  1)
2 2
n 2
El estimador ̂ 2 tiene menor varianza, por lo que es más eficiente que ̂1
Consistencia:
Un estimador ̂ es consistente cuando lim E(ˆ )   y lim V(ˆ )  0

n n
 lim E(ˆ 1 )  lim E(x)  

n   n 
ˆ 1   2 es consistente
 lim V(ˆ 1 )  lim 0
n   n  n
  1 
lim
n   2E(ˆ )  lim      
 n 
 n1 
ˆ 2   es consistente
 lim V(ˆ )  lim  n  2   0
n    (n  1) 2 
 n  
2
 
2
b) ECM(ˆ )  E(ˆ  ) 2  V(ˆ )  b(ˆ ) sesgo b(ˆ )   E(ˆ )   
2 2 2
ECM(ˆ 1 )  V(ˆ 1 )   b(ˆ 1 )  0
n n
2
2 n  1  n 2   2
ECM(ˆ 2 )  V(ˆ 2 )   b(ˆ 2 )    
2
 
(n  1) 2  n1  (n  1) 2
 2 n 2   2
El estimador ̂1 será elegido sí ECM(ˆ 1 )  ECM(ˆ 2 )  
n (n  1) 2
n 2   2 n 2 2 2 n 2 2
    
(n  1) 2 (n  1) 2 (n  1) 2 n (n  1) 2 (n  1) 2

2 n 2 2 (n  1) 2  2  n 2  2 2
    
n (n  1) 2 (n  1) 2 n(n  1) 2 (n  1) 2
(2n  1)  2 2 (2n  1)  2
    2
n(n  1) 2 (n  1) 2 n 
 2n  1 2
 Si  2  ˆ 1 se elige antes que ˆ 2
 n 

 2n  1
 Si 2
 2  ˆ 2 se elige antes que ˆ 1
 n 
 Sea (x 1 ,x 2 ,  ,x n ) una muestra aleatoria simple de una variable
aleatoria X con E(X)   y Var(X)   2
Calcular el error cuadrático medio para los siguientes estimadores de  :
3x 1  2x 2  x 3
ˆ 1  x 1 ˆ 2 
6
Solución:
 Insesgadez
E(ˆ 1 )  E(x 1 )    b(ˆ 1 )  0
  3x 1  2x 2  x 3  1
 E( ˆ 2 )  E  6   6  3E(x 1 )  2E(x 2 )  E(x 3 ) 

 1 2 1
   3   2        
 6 6 3
 1 2
 b(ˆ 2 )  E(ˆ 2 )          sesgo
 3 3
Respecto al sesgo es mejor el primer estimador ̂1 que es insesgado o
centrado.
 Varianza
Var( 1 )   2

 3x  2x 2  x 3  1
Var( 2 )  Var  1   Var  3x 1  2x 2  x 3  
 6  36
1 1
  9Var(x 1 )  4 Var(x 2 )  Var(x 3 )   9  2  4  2   2  
36 36
14 7
  2   2
36 18
Respecto a la varianza es mejor el segundo estimador ̂ 2 por ser
7 2
  2
18
 El mejor estimador será el que presente menor Error Cuadrático Medio
2
ECM(ˆ 1 )  V(ˆ 1 )   b(ˆ 1 )   2  0   2
2
2 7 2  2  7 2 4 2
ECM(ˆ 2 )  V(ˆ 2 )   b(ˆ 2 )           
18  3  18 9
El primer estimador ̂1 será mejor sí

7 2 4 2 11 2 4 2 4 x 18 2 8 2
2          2    2  
18 9 18 9 9 x 11 11

 La distribución del peso de las manzanas de una determinada
cosecha sigue una distribución normal, cuyo peso medio es desconocido y
cuya desviación típica es 7 gramos. Se pide:
a) Analizar cuál de los estimadores ̂1 , ̂ 2 del peso medio es mejor
respecto del sesgo y de la eficiencia, para una muestra aleatoria
simple de tamaño cinco.
5
x
i1
i
b) Si ˆ 1  y ˆ 2  x 1  2x 2  3x 3  4 x 4  x 5 , obtener los pesos

5
medios estimados a partir de la muestra (125, 135, 130, 137, 142).
Solución:
a) El peso de las manzanas sigue una distribución N( , 7)
Se calculan las esperanzas para analizar el sesgo de los estimadores.
 5
 1 
5
 5
  
1 1
E(ˆ 1 )  E  x i / 5  E  xi  E  x i   (5 )  
 i 1  5  i 1  5 i 1
5
E(ˆ 2 )  E(x 1  2x 2  3x 3  4 x 4  x 5 )  E(x 1 )  2E(x 2 )  3E(x 3 )  4E(x 4 )  E(x 5 ) 

   2   3   4     
Los estimadores ̂1 , ̂ 2 son insesgados (centrados).
b) Para analizar la eficiencia de los estimadores se obtienen las varianzas:
 5  1 
5  5
  
1 1 49
V(ˆ 1 )  V  xi / 5  V xi   V xi   (5. 49) 
 i  1  25  i  1 
 
25 i1
25 5
V(ˆ 2 )  V(x 1  2x 2  3x 3  4 x 4  x 5 ) 
 V(x 1 )  4 V( x 2 )  9V( x 3 )  16 V( x 4 )  V( x 5 ) 
 (49)  4 (49)  9 (49)  16 (49)  (49)  31 (49)  1519
Como los dos estimadores son insesgados y V(ˆ 1 )  V(ˆ 2 ) se elige como

mejor el estimador ̂1 , el peso medio de la muestra de las cinco
manzanas.

 Sea (x1 ,x2 ,x3 ,x4 ,x5 ) una muestra aleatoria simple de una variable
aleatoria X con distribución normal con media (  5) y varianza  2 . Se
proponen los siguientes estimadores:
5
ˆ 1  x
i1
i ˆ 2  8x 2  3x 5
Determinar cuál es el mejor estimador para  . Justificar la respuesta.
Solución:
 Insesgadez
 5

E(ˆ 1 )  E 


i1
x i   E  x 1  x 2  x 3  x 4  x 5   5(  5)


E(ˆ 2 )  E  8x 2  3x 5   8E(x 2 )  3E(x 5 )  8(  5)  3(  5)  5(  5)
Ambos estimadores son sesgados, con idéntico sesgo:
b(ˆ 1 )  b(ˆ 2 )  5(  5)    4   25
 Varianza
 5

Var(1 )  Var 
  x i   5Var(x)  5  2

 i1 
Var( 2 )  Var  8x 2  3x 5   82 Var(x 2 )  32 Var(x 5 )  64  2  9  2  73  2
Dado que los dos estimadores tienen el mismo sesgo y el primer
estimador 1 tiene menor varianza, será el estimador óptimo.
Puede observarse que presenta el menor Error Cuadrático Medio:
ECM(ˆ 1 )  V(ˆ 1 )   b(ˆ 1 )  5  2   4   25 

2 2
ECM(ˆ 2 )  V(ˆ 2 )   b(ˆ 2 )  73  2   4   25 

2 2

 El peso en kilos de los jamones vendidos por una empresa sigue una
distribución normal con varianza 4 y peso medio desconocido. Se conoce
que el peso medio de los jamones vendidos es superior a 5 kg, y se toman
m.a.s. de tamaño 4 para estimar  . ¿Cuál de los dos estimadores sería el
mejor respondiendo a la insesgadez y eficiencia?
x  x2  x3 x  x2
ˆ 1  1 ˆ 2  1
4 2
Solución:
La v.a X i  'peso en kg de los jamones' sigue una distribución normal de
varianza  2  4
Para estudiar la insesgadez de los estimadores se calculan sus esperanzas:
 x  x2  x3  1 3
 E(ˆ 1 )  E  1 
 4 
 E(x 1 )  E(x 2 )  E(x 3 ) 
  
 4  4
3 1
El sesgo del estimador ̂1 será: b(ˆ 1 )  E(ˆ 1 )         
4 4
 x  x2  1 2
 E(ˆ 2 )  E  1  
 2 1E(x )  E(x )
2     
 2  2
El estimador ̂2 es insesgado, b(ˆ 2 )  0
Atendiendo al sesgo se elige ̂2
Para analizar la eficiencia relativa de los dos estimadores se calculan las
respectivas varianzas
 x  x2  x3  1
V(ˆ 1 )  V  1  16 
 V(x 1  x 2  x 3 ) 

 4 
Observaciones
 independientes
1 1 12 3
  V(x 1 )  V(x 2 )  V(X 3 )   12  
16 V(x )  4 16 16 4
i
 x  x2  1 1 1
 V(ˆ 2 )  V  1 
 4  V(x 1  x 2 )   
 V(x 1 )  V(x )
2   8  2
 2  4 4

Respecto a la varianza se elige el estimador ̂1 por ser el de menor
varianza.
Aparecen decisiones contrapuestas, de modo que el estimador se elige en
base al error cuadrático medio: ECM  Varianza  (sesgo) 2
2
ˆ 3    2  12
ECM(1 )       ECM(ˆ 2 )  2  0  2
4  4 16
Se analiza cuando es mayor el ECM el primer estimador ̂1 :
 2  12
ECM(ˆ 1 )  ECM(ˆ 2 )   2   2  20    20  4,47
16
Si  es en valor absoluto mayor que 4,47, el error cuadrático medio de ̂1
es mayor, con lo que se elige el estimador ̂2 .
Se conoce que el peso medio de los jamones es superior a 5 kg, no queda
duda que el estimador a elegir (con menor error cuadrático medio) es ̂2
 Supongamos que la distribución de ingresos de una cierta población es
una variable aleatoria con media  desconocida y varianza 2 también
desconocida. Si queremos estimar el ingreso medio de la población
mediante una m.a.s. de tamaño n, respecto de la insesgadez y de la
eficiencia. ¿Cuál de los dos estimadores elegiríamos?. ¿Son consistentes?
n n
x
i1
i x
i1
i
ˆ 1  ˆ 2 
n1 n
Solución:
La v.a x i  'ingresos de cierta población' sigue una distribución normal
N( , )
Para analizar el sesgo de los estimadores, se calcula la esperanza:

 n xi   n  n
   E(x ) 
1 1
E(ˆ 1 )  E   E xi 
 i  1 (n  1)  n  1  i  1  n  1
i
 i1
1 n
 (n )  
n1 n1
n 1
El sesgo del estimador ̂1 será: b(ˆ 1 )  E(ˆ 1 )     
n1 n1
 n x  1  n  1 n
  
1
 E(ˆ 2 )  E  i
 E xi  E(x i )  (n )  
 i  1  n
n  i  1  n i1
n
El estimador ̂ 2 , que es la media muestral, es insesgado (centrado) y el
estimador que se elige.
 La eficiencia de los estimadores se analiza a través de su varianza:
 n x   n  n
   V(x ) 
1 1
V(1 )  V
ˆ  i
  V  x  
 i  1 n  1  (n  1)  i  1  (n  1)
2 i 2 i
 i1
1 n 2
 (n  ) 
2
(n  1) 2 (n  1) 2
 n x  1  n  1 n
2
  
1
 V(ˆ 2 )  V  i
  2 V xi  V(x i )  2 (n  ) 
2
 i  1 n  n  i  1  n i1
n n
El estimador más eficiente será el de menor varianza. Comparando las
varianzas de los estimadores:
2 n 2
V(ˆ 2 )    V(ˆ 1 ) puesto que (n  1)2  n2
n (n  1) 2
El estimador ̂ 2 , que es la media muestral, es el mejor tanto al sesgo
como a la eficiencia.
Los dos estimadores son consistentes:

 n 2
 nlim E(ˆ 1 )   y lim V(ˆ 1 )  lim 0
   n  n   (n  1) 2

 lim E(ˆ )   y lim V(ˆ )  lim   0
2
 n   2
n 
2
n  n
Nota: El estimador de máxima verosimilitud (probabilidad conjunta) de 
es el formado por los valores (ˆ 1 ,  , ˆ n ) que maximizan la función de
verosimilitud de la muestra (x 1 ,  ,x n ) obtenida:
L()  L(X; )  L(x 1 ,  ,x n ;  )  P(x 1 , )  P(x n , ) caso discreto
En muchas ocasiones, es más práctico encontrar el estimador de máxima
verosimilitud al considerar la función Soporte o Log‐verosimilitud
ln L(X , ) , en lugar de la función de verosimilitud L() , ya que es más fácil
de manejar y presenta los mismos máximos y mínimos.
 ln L()
Se despeja ˆ  (ˆ 1 ,  , ˆ n ) de la ecuación:  0 y se obtiene
   ˆ
el estimador de máxima verosimilitud E.M.V(ˆ )
 Un atleta olímpico de salto de altura se enfrenta a un listón de 2,3
metros. Su entrenador desea estudiar el comportamiento del saltador.
Sabe que el número de saltos fallidos por hora es una variable aleatoria
distribuida como una Poisson de parámetro .
a) Calcular el estimador máximo verosímil del parámetro .
b) Analizar sus propiedades.
Solución:
a) Sea la v.a. X = 'número de saltos fallidos por hora'
 x    E(x)  
En la distribución de Poisson: P(X  x)  e 
x!  V(x)  
La función de verosimilitud L(X,  ) en una muestra aleatoria simple de
tamaño n:

n
n
 xi
 x1    xn    i1
L( )  L(X ,  )   P(x i ,  )  e  e  n e n 
x!
i1
x1 ! xn !
i
i1
n  n 
 xi   xi 
 i1
  i1

L(X ,  )  n e n   ln L(X ,  )  ln  n e n   
i1
 xi ! 
 i 1

x i! 



n
 xi n n n
 ln ( i1
)  ln (  x !)  ln(e
i1
i
 n
)  x ln   ln(x !)  n
i1
i
i1
i
n n
ln L(X ,  )   x ln   ln(x !)  n

i1
i
i1
i
Para obtener el estimador de máxima verosimilitud EMV(ˆ ) , se deriva la

expresión anterior respecto del parámetro para obtener, sustituyendo 
por ̂
n
n  xi
 lnL(X ,  )

1 i1
 0  xi  n  0  ˆ   x
   ˆ i1
 n
  ˆ
El estimador de máxima verosimilitud (estimador que ofrece mayor
credibilidad) viene dado por la media muestral EMV(ˆ )  x
b) Propiedades de Insesgadez, Consistencia y Eficiencia
 Insesgadez
El estimador ̂ es insesgado (centrado) sí E(ˆ )  
 n
xi 
 i1 
n

1 n 1 1
E(ˆ )  E    E( x i )  E(x i )  (n  )  
 n  n i 1 n i1
n
 

 n
xi 
 i1  1 n


1
V(ˆ )  V(x)  V   2 V(x i )  2
(n  ) 
 n  n i1
n n
 
 Consistencia
Cuando no es posible emplear estimadores de máxima verosimilitud, el
requisito mínimo deseable para un estimador es que sea consistente.
El estimador ̂ es consistente cuando lim E(ˆ )   y lim V(ˆ )  0

n  n 

lim E(ˆ )  lim    y lim V(ˆ )  lim 0
n  n  n  n  n
El estimador ̂ es consistente
Para que un estimador sea eficiente tiene que ser centrado y de varianza
mínima. La varianza mínima se analiza en virtud de la acotación de
Cramer‐Rao:
2
1  b(ˆ )
V(ˆ )  CCR  2
  ln P(x 1 , x 2 ,  , x n ;  ) 
E 
  
La cantidad de información de Fisher I( ) puede simplificarse en una
muestra aleatoria simple (m.a.s.), obteniendo la expresión:
2
  ln P(x 1 , x 2 ,  , x n ;  )    ln P(x ;  ) 
I( )  E    n.E  
     
2
1  b(ˆ ) b(ˆ )  0 1
V(ˆ )  CCR  2
 V( ˆ )  CCR 
 2
  ln P(x ;  )    ln P(x ;  ) 
n.E   n.E  
     
El estimador es eficiente cuando V(ˆ )  CCR
 Eficiencia
 x 
Siendo, P(X  x)  e
x!

  x  
lnP(x ,  )  ln  e   xln   ln(x!)  
 x! 
 lnP(x ,  ) x x
  1 
  
2
  lnP(x ,  ) 
2
x   1 1 1
E   E     E(x   ) 2
 E(x  x) 2
 V(x) 
      2
 2
 2
 1
 2 
 
1 
En consecuencia, V(ˆ )  
1 n
n


El menor valor de la varianza del estimador será
n

Se sabe que V(ˆ )  V(x)  , lo que muestra V(ˆ )  CCR , el estimador
n
empleado es eficiente.
 Sea la distribución N( , ) , con la media y varianza desconocidas.

Calcular los estimadores máximo‐verosímiles de  y  2
Solución:
Función de verosimilitud:
L(X;  ,  2 ) 
 1 (x   )  1 (x   )   1 (x   ) 
2 2 2
 1 2  2 2  n 2
  e 2  e 2   e 2 
 2  2   2  2   2  2 
n
 (xi   ) 2
i1

1 2 2
 n n
e
(2 ) ( )
2 2 2
Función soporte o Log‐verosimilitud:

  (xi   ) 2 
n
 1 
i 1 
ln L(X;  ,  )  ln   
2
2 2
e
 n n

 (2 ) ( )
2 2 2

 
n
n n i1
 (x  ) i
2
  ln(2 )  ln( 2 ) 

2 2 2 2
n
n n i1
 (x  ) i
2
ln L(X;  ,  2 )   ln(2 )  ln( 2 ) 

2 2 2 2
Para obtener los estimadores de máxima verosimilitud de ̂ y ̂ 2 se

deriva la expresión anterior respecto de los parámetros, sustituyendo 
por ̂ e  2 por ̂ 2 , e igualando a cero:
n n
  ln L(X;  ,  2 ) 
 (x  ˆ )
i1
i x
i1
i
    0  ˆ  x
     ˆ 2 n
n n
  ln L(X;  ,  ) 
2
n
 (x  )
i1
i
2
 (x  )
i1
i
2
      0  ˆ 2 
  2  2  ˆ 2 ˆ ˆ 3 n
n
 (x i  x)
2
i1
En conclusión, ˆ  x y ˆ 2    2x
n
 2 ln L(X; )  n
La condición de máximo se verifica, pues:     0
  2
   ˆ  2
Los estimadores máximo‐verosímiles de  y  2 son la media y la varianza

muestrales.

 En una distribución N( , ) , se estima la media poblacional 
mediante la media de una muestra aleatoria simple (x 1 ,x 2 ,  ,x n ) . El
2
estimador es insesgado y su varianza V(x)  .
n
Demostrar que la media muestral es un estimador eficiente.
Solución:
La varianza de un estimador verifica siempre la Cota de Cramer‐Rao:
V(ˆ )  CCR . Un estimador es eficiente cuando V(ˆ )  CCR
Para obtener la cota de Cramer‐Rao se parte de la función de densidad
poblacional:
1
CCR  2
 lnf(x, ) 
nE  
  
(x   )2

1 2 2
Función de densidad poblacional: f(x, )  e
 2
Tomando logaritmos neperianos, se tiene:
 1 (x   ) 
2
 1 (x  )2
lnf(x, )  ln  e 2    ln   ln2  
2
  2 2
  2  2
Derivando respecto a  :
2
 lnf(x, ) 1 x  lnf(x, )  (x  )
2
  2  2(x  )  2     4
 2    
La esperanza matemática:
 (x  )2   2
2
  lnf(x, )  1
E   E  4  4 2  
    
Sustituyendo el valor de la esperanza matemática en la expresión de la
cota para estimadores insesgados:

1 1 2
CCR  2
 
 lnf(x, )  1 n
nE  n 2
  
 
La varianza del estimador coincide con la cota de Cramer‐Rao, V(x)  CCR ,
concluyendo que la media muestral es un estimador eficiente de la media
poblacional en la distribución normal.
 Calcular el estimador máximo verosímil del parámetro 'a' de las
funciones:
a) f(x ,a)  a2 e  ax siendo x  0 en muestras aleatorias simples
de tamaño n
b) f(x,a)  ae ax para x  0 , a  0 en muestras aleatorias simples
de tamaño 2
Solución:
a) f(x ,a)  a2 e  ax f(x ,a)  a2 e  ax donde x  0 en m.a.s. de tamaño n

n
 ax1  ax 2  axn
a  xi
L(X , a)  L(x 1 , x 2 ,  , x n ; a)  (a e 2
).(a e 2
)  (a e
2
) a e
2n i1
n
a  xi n
ln L(X , a)  ln (a e
2n i1
)  2n lna  a x
i1
i
Para obtener el estimador de máxima verosimilitud EMV(a)ˆ , se deriva la

expresión anterior respecto del parámetro para obtener, sustituyendo a
por â e igualando a cero:
 ln L(X , a) 2n n 2n 2 2
   xi  0  aˆ  n   aˆ 
a a i  1 a  aˆ x x
a  aˆ xi 
i 1
b) Sea f(x,a)  ae ax para x  0 , a  0 en m.a.s. de tamaño 2


L(X , a)  L(x 1 , x 2 ; a)  (ae ax1 ).(ae ax2 )  a2 e a(x1  x2 )
ln L(X , a)  ln  a2 e  a(x1  x2 )   2 lna  a(x 1  x 2 )
Derivando respecto de a, igualando a cero y sustituyendo a por â :
 ln L(X , a) 2 2 1
  (x 1  x 2 )  0  aˆ  
a a  aˆ
a a  aˆ x1  x 2 x
 En una distribución N( , ) se estima la media poblacional  en una

muestra aleatoria simple de tamaño n (x 1 ,x 2 , ,x n ) por medio de la
función muestral:
n
 ix
i1
i
ˆ 
n
Estúdiese la eficiencia del estimador.
Solución:
Un estimador es eficiente cuando V(ˆ )  CCR

Para hallar la cota de Cramer‐Rao se necesita saber en primer lugar si el
estimador es insesgado o no, se calcula para ello la esperanza
matemática:
 n 

 ix i  n
E(ˆ )  E 
i1 1
 n  n  E(ix ) 
i1
i

1 1

n
i E(x i ) 
n
E(x1 )  2E(x 2 )  3E(x3 )    nE(xn ) 
i1
1 

n
   2   3     n  )   1  2  3    n  
n

 (n  1) n (n  1)
  
n 2 2
n1 n1
E(ˆ )    b(ˆ )  sesgo b(ˆ )  E(ˆ )       
2 2
Varianza del estimador:
 n 
  ix i n n
V(ˆ )  V   1
  i V(x ) 
 1
V(ix i )  2
i 1 2
 n  n2 n
i
i1 i1
1 2
 1 V(x 1 )  22 V(x 2 )  32 V(x 3 )    n2 V(x n ) 
2 
n
1 2 2 2 2
 2 1   2   3     n    2 1  22  32    n2  
2 2 2 2 2 2
n n
 2 n (n  1)(2n  1)  2 (n  1)(2n  1)
 2  V(ˆ ) 
n 6 6n
1  b(ˆ )
2
Cota de Cramer‐Rao CCR  2
  lnL(x, ) 
nE  
  
2
n1 (n  1)
1  b(ˆ )  1  2    4
2
2
La Información de Fisher I()  n I0 () de la muestra:

2 2
  lnL(X, )    lnL(x, ) 
I0 ()  E    nE  
     
se obtiene a partir de la función de densidad poblacional
(x   ) 2

1 2 2
f(x, )  e
 2
Tomando logaritmos neperianos, se tiene:

 1 (x   ) 
2

1 (x  ) 2
lnf(x, )  ln  e 2    ln   ln2  
2
  2  2 2  2
 
Derivando respecto a :
2
 lnf(x, ) 1 x   lnf(x, )  (x  )
2
  2(x  )  2     4
 2 2    
 (x  )2   2 1
2
  lnf(x, ) 
La esperanza matemática: E    E   4 2
     4
  
n
Atendiendo a la aditividad de esta medida: I()  n I0 () 
2
(n  1)2
 1  b(ˆ )
2
4 (n  1)2  2  2 (n  1)(2n  1)
CCR  2
   V(ˆ ) 
  lnL(x, )  n 4n 6n
n E   2
  
Al ser la varianza del estimador mayor que la cota de Cramer‐Rao:
 2 (n  1)(2n  1) (n  1)2  2
V(ˆ )    CCR
6n 4n
El estimador no es eficiente, siempre que n  1
2
Para n  1 : V(ˆ )  CCR  el estimador es eficiente.
n

Para que un estimador sea eficiente tiene que ser centrado y de varianza
mínima. La varianza mínima se analiza en virtud de la acotación de
Cramer‐Rao (conocida también como desigualdad de la información).
En el caso continuo:
1 1 1
V( ˆ )  CCR   
I()   ln L(x ; ) 
2
  ln f(x ; ) 
2
E  n E 
     
La información de Fisher I() es una cota inferior para la varianza de un
estimador insesgado del parámetro.
Un estimador es eficiente cuando V( ˆ )  CCR  I( )1
Cuando se extiende la condición de regularidad a la segunda derivada en
un parámetro bidimensional   ( , ) , se puede utilizar una forma
alternativa de la información de Fisher para obtener una nueva
desigualdad de Cramer‐Rao:
1 1 1
V( ˆ )  CCR   
I()  2 ln L(x ; ) 
2
 2 ln f(x) 
2
E   n E 
 2   
2

Un estimador es eficiente cuando V( ˆ , ˆ )  CCR  I(  , )1
La matriz de información de Fisher I( , ) , matriz de segundas derivadas
(Jacobiano), viene dada por la expresión:
 2 2 
  ln L(  ,  ) ln L(  ,  ) 

I( , )   E  
 2  2 
 ln L( , ) ln L( , )
    

 A partir de una muestra aleatoria simple X de tamaño n, determinar
la matriz de información de Fisher de una población con distribución
N( , ) , respecto a los dos parámetros  y .
Solución:
(x   )2

1 2 2
Función de densidad poblacional: f(x)  e
2  2
L( , )  L(X;  , ) 
 (x   )  (x   )   (x   ) 
2 2 2
1  1  1 
  e 2  e 2   e 2 
2 2 2
 2  2   2  2   2  2 
n
 (xi  ) 2
i1

1 2 2
 n n
e
(2 ) 
2 2
  (xi  ) 2 
n
 1 
i1  n n 1 n
ln L(  , )  ln      ln2   ln   2  (x i  ) 2
2
2 2
e
 n n
 2 2 2 i  1
 (2  ) 2
 2

 
Para determinar la información de Fisher se deriva la expresión anterior
respecto de los parámetros  y  :
n n 1 n
ln L(  , )   ln2   ln   2  (x i  ) 2
2
2 2 2 i  1
ln L(  , ) 1 n
 2  (x i  )
  i1
n
ln L(  , ) n
 (x  )
i1
i
2
 
  3

 n


1
Cálculo de las segundas derivadas   x , ˆ 2  (x i  x)2 
 n i1 
2 ln L(X;  , )   1 n  1 n
  2  (x i  )   2 
 (x , ˆ 2 )
   i  1  (x , ˆ 2 )  (x , ˆ 2 ) ˆ 2
2 ln L(X;  , ) 2 ln L(X;  , )   1 n 
   2  (x i  )  
  (x , ˆ 2 )
  (x , ˆ 2 )
   i  1 (x , ˆ 2 )
n
2  (x i  )
i1
 0
3 (x , ˆ 2 )
 n

2 ln L(X;  , )

  n
 (x  )i
2

  
i1  
  
   3 
(x , ˆ 2 ) (x , ˆ 2 )
n
3  (x i  ) 2
2  3  
n 2
n n
 2   (x i  )  6 
i1
 2 
 i1    (x , ˆ 2 )  4 (x , ˆ )2
n 3n ˆ 2 2n
 2 4  2
ˆ ˆ ˆ
Matriz de Información de Fisher I( , ) :
 2 2 
  ln L(  ,  ) ln L(  ,  ) 
  
I( , )   E
  2
 2 
 ln L( , ) ln L( , )
     
 n   n 
  ˆ 2 0   2
ˆ
0 
  
 0 2n 2n 
 2  0
 ˆ   ˆ 2 

Al ser x i un elemento de una muestra aleatoria simple de una población
normal N( , ) , se tiene que E(x i  )  0 y E(x i  )2   2
 Se puede obtener la distribución de (ˆ , ˆ )
(x   )2

1 2 2
f(x)  e
2  2
Función soporte:
 (x   )2 
  (x  2 ) 
2
   ln 

1 1  e 2  
ln f(x)  ln  e 2 2
  ln  
 2  2 2  2  
  
 (x  )2  1  (x  )2 
  ln 2   
2
2  2    ln  2   
2   2


 
 
1  (x  )2 
  ln 2   ln    
2  2 
Para determinar la información de Fisher se deriva la expresión anterior
respecto de los parámetros  y  :
1  (x  )2 
ln f(x)   ln 2   ln    
2  2 
 (x  )
ln f(x) 
 2
 1 (x  )2  2   1 (x  )2
ln f(x)    4  
  2     3
Cálculo de las segundas derivadas:
2 1
f(x)   2
 
2 2  2  2(x  )
f(x)  f(x)  (x  ) 4   
       3

2 2  3   1 3(x  ) 2
2
1
f(x)  2  (x  )  6   2 
       4
Matriz de Información de Fisher I( , ) :
 2 2 
  f(x) f(x) 

I0 ( , )   E   
  2
2 
 f(x) f(x) 
    
 1 2(x  )   1 2(x  ) 
     2 
2 3 3
 E   E 
  2(x  ) 1 3(x  ) 2   2(x   ) 1 3(x   ) 2

       
3  2
 4 3
 2
 4
 1   1 
 2 0   2 0 
  
 0 1 3 2   2 
  2 4  0
     2 
Como x un elemento de una muestra aleatoria simple de una población
normal N( , ) , se tiene que E(x  )  0 y E(x  )2   2
 1 
 2 0 
La matriz de información de Fisher: I0 ( , )   
 0 2 
  2 
Atendiendo a la aditividad de esta medida:
 1   n 
 2 0   2 0 

I( , )  n I0 ( , )  n   
 0 2   2n 
0
  2    2 

1 2 
0   0 
2
0
2   2 4
   
2 1
 4  I0 ( , )   2 
2  2  1  0
0

0 
 2 
2  
2
Por el Teorema Central del Límite la distribución asintótica de (ˆ , ˆ )t es:

 2 0 
     
ˆ  0  
n         N 0 , I0 ( , )1   N   ,  2  

  ˆ       0   0 
  2  
Una aplicación directa se encuentra en el Valor en Riesgo o Value at Risk
(VaR), medida ampliamente utilizada en una cartera de inversiones de
activos financieros.
En una cartera de inversiones, asumiendo mercados normales y que no
se produce negociación en la cartera, el VaR se define como un valor
límite tal que la probabilidad de que una pérdida a precios de mercados
en la cartera sobre un horizonte temporal dado exceda ese valor
sea el nivel de probabilidad dado.
Parámetros comunes para el VaR son probabilidades de 1% y 5% y
horizontes temporales de un día y de dos semanas, aunque también se
utilizan otras combinaciones.
PRÁCTICA: Una empresa que cotiza en Bolsa considera como pérdidas
todos los rendimientos inferiores a 3 euros por acción, es decir, los
beneficios siguen una distribución N   3 ,   .
Las pérdidas máximas esperadas para un nivel de significación  son
VaR    3  z  .
  ˆ  3  z ˆ
La distribución del estimador VaR 
  ˆ  3  z ˆ   1  z   ˆ   3
VaR    
 ˆ 
La distribución asintótica de (ˆ , ˆ ) : t   VaR   N 0 ,

n  VaR  z
2 2 
2


 2 

MÉTODO DE LOS MOMENTOS: Procedimiento consistente en igualar
momentos poblacionales respecto al origen  r a los correspondientes
momentos muestrales respecto al origen ar , formando así tantas
ecuaciones como parámetros poblacionales se pretenden estimar:
n
x
i1
i
1  E(X)    
ˆ 1  a1  x
n
n
 x 2i
  E(X 2 )  
ˆ 2  a2  i1
2
n

n
x
i1
r
i
r  E(X r )  
ˆ r  ar 
n
1 
 Sea una población definida por: P(X  1)  , P(X  0)  ,
2 2
1
P(X  1)  , donde 0    1 , 0    1 . Estimar los parámetros  y
2
 por el método de los momentos, estudiando si son insesgados.
Solución:
Puesto que hay que estimar dos parámetros  y  hay que calcular los
dos primeros momentos.
momentos poblacionales
  
1    E(X)  
x i P(X  x i ) 
i
 1      1  

 (1)    (0)    (1)  
 2   2   2  2
 2  E(X 2 )  
i
x 2i P(X  x i ) 
 1  2    2  1  2 

 (1) 2    (0)    (1)   
 2   2   2  2

momentos muestrales

xi  x 2i 
a1  x  i
a2  i
n n
 

 1 1 a   x      2 x
2
 
  a  2    
 a2       2a2  2
 2 2
2
     2x ˆ  1  a2  x

  
     2a2  2 ˆ  1  a2  x
 Insesgadez
E(ˆ )  E(1  a2  x) 
 2     
 1  E(a2 )  E(x)  1  2    1     
 2   2 
E(ˆ )  E(1  a2  x)  1  E(a2 )  E(x) 
 2     
 1   2    1     
 2   2 
Los estimadores  y  son insesgados.

Un estimador ̂ es suficiente cuando no da lugar a una pérdida de
información. Es decir, cuando la información basada en ̂ es tan buena
como la que hiciera uso de toda la muestra.
Para identificar estadísticos suficientes se utiliza el Teorema de
Factorización, que establece que dada una muestra aleatoria (x 1 ,  ,x n )
de una población X con función de densidad f (caso continuo) un
estadístico ̂ es suficiente para  sí y sólo sí:
f (x 1 ,  ,x n )  g  ˆ (x 1 ,  ,x n ),   . h(x 1 ,  ,x n )
Para encontrar un estadístico suficiente ̂ hay que factorizar la función de
verosimilitud de la forma: L()  g(ˆ , ) . h(x 1 ,  ,x n )
 Una muestra aleatoria (x 1 ,  ,x n ) de la población tiene como función
  x   1 si x (0,1)
de densidad f (x)    > 0
 0 en el resto
a) Hallar un estadístico suficiente
b) Estimador de máxima verosimilitud de 
c) Estimador de por el método de los momentos
Solución:
a) Para encontrar un estadístico suficiente ̂ hay que factorizar la función
de verosimilitud de la forma: L()  g(ˆ , ) . h(x 1 ,  ,x n )
L()  f (x 1 ) f (x 2 )  f (x n )  ( x 1  1 ) ( x 2  1 )  ( x n  1 )  n (x 1  x n )  1
Por tanto, ˆ   x 1 ,  ,x n  es un estadístico suficiente.
b) L()  n (x 1 ,  ,x n ) 1


n n
ln L()  ln  n (x 1 ,  ,x n ) 1   ln n  ln x i  1  ln n  
ln(x i  1 ) 
  i1 i 1
lnL() n
n n
lnL()  n ln    1 ln(x i ) 
i1 
 

  ln(x )  0
i1
i
n
 ˆ   n

ln(x i )
i1
c) Se plantea la ecuación E X   x
1
 x  1  
  
1 1 1
x  E(X)  x f (x)dx  x  x   1 dx  
 x dx     
0 0 0   1 0   1
x
x (  1)    ˆ 
1 x
de densidad
 e x   si x  0
f (x)  
 0 en el resto
a) Hallar un estimador por el método de los momentos de 
b) Estudiar si el estimador encontrado en el apartado anterior es
insesgado para estimar el parámetro 
Solución:
a) Se plantea la ecuación: E X   x
integración por partes



 
x  E X  

x f (x)dx 

x e  x   dx    1  ˆ  x  1
 
x
x e
 dx  x(
   e  x   )   e  x   dx
   xe x  e x 
u u
  du
dv v v

 1 x 
  (1  x) e  x     e    x 
 e 


 1 x 

x 
xe dx   e  x   1 
  e 
b) Un estimador es insesgado o centrado cuando su valor probable
coincide con el valor del parámetro a estimar. Es decir, E  ˆ   
E  ˆ   E(x  1)  E(x )  1  (   1)  1  
θ2 x e θ x si x  0
de densidad fθ (x)  
0 en el resto
Hallar el estimador de máxima verosimilitud de 
Solución:
La función de verosimilitud L()
L(θ)  fθ (x 1 ) fθ (x 2 )  fθ (x n )  θ2 x 1 e 1   θ2 x e θ x 2   θ2 x e θ x n  

θx
   2   n 
n
 ( x1   x 2     xn )
  xi
  (x 1  x n ) e
2n
  (x 1  x n ) e
2n i1

n
 xi  n
   xi

L()  2n (x1  xn ) e i1
 ln L()   ln 2n (x1  xn ) e i  1 
n n
ln L()  (2n) ln   ln x
i1
i  x
i1
i 
n n
 lnL()  (2n) ln    lnx
i1
i  x i1
i
lnL()
n

2n 2n
  x i  0  ˆ 
  n
i1
x
i1
i

 El coseno X del ángulo con el que se emiten los electrones en un
proceso radioactivo es una variable aleatoria con función de densidad
(1   x) 2 1  x  1 ,  1   1
f (x)  
 0 en el resto
Se considera una muestra aleatoria (X1 ,  ,Xn ) de la variable aleatoria

a) Obtener el estimador  por el método de los momentos
b) Calcular la varianza de este estimador y demostrar que es consistente
Solución:
a) Se plantea la ecuación E X   x
1
 1 x   x 2 x 3  

1
x  E X   x  dx       ˆ  3 x
1  2  2 6  1 3
V(X) 9
b) V(ˆ )  V(3 x)  9V(x)  9  V(X)
n n
2
 1 x  

1
2
V(X)  E(X )  E(X) 
2
x 2
 dx    
1  2  3
1
 x 3 x 4 
2
 3  2
       
 6 8  1  3  9
ˆ 9 9 3  2  3  2
de donde, V()  V(X)   
n n  9  n
Consistencia o robustez del estimador ˆ 

lim E(ˆ )  lim E(3 x)  lim 3E(x)  3E(X)  3 
n n n 3
ˆ 3  2
lim V()  lim V(3 x)  lim 0
n n n n
Queda probado que el estimador ̂ es consistente

 En un estacionamiento el número de veces que se abre la barrera en
un intervalo de 10 minutos, para que pasen vehículos en un sector de
seguridad, se considera una variable aleatoria con distribución de Poisson
de parámetro  desconocido.
a) En una muestra aleatoria de 8 intervalos de 10 minutos cada uno,
elegidos de forma independiente, se registra para cada intervalo el valor
que toma la variable en estudio.
3 5 8 7 4 5 6 2
Encontrar la estimación máximo verosímil de 
b) Sea (x 1 ,  ,x n ) una muestra aleatoria de tamaño n que sigue una
x  3x n
n

xi ˆ
distribución de Poisson. Si ˆ 1  ,  2  1 son estimadores.
i1
n 4
Determinar el mejor estimador del parámetro 
Solución:
a) X = "número de veces que se abre la barrera en un intervalo de 10
minutos", X  P( )
  x 
 e x  0, 1, 2, ...
P(X,  )   x!
 0 otro caso

n
n
 xi
   i1

x1 xn
L( )  L(X ,  )  P(x i ,  )  
e  
e  n e n 
x!
i1
x1 ! xn !
i
i1
  xi 
n
n
    xi  n


i  1
n
lnL(X ,  )  ln  n e   ln( )  ln 
i1
x i !   ln(e n  ) 
 


 i1
xi !



 i1 
n n
  x ln   ln(x !)  n

i1
i
i1
i

n n
lnL(X ,  )   x ln   ln(x !)  n

i1
i
i  1
i
Para obtener el estimador de máxima verosimilitud EMV(ˆ ) , se deriva la

expresión anterior respecto del parámetro para obtener, sustituyendo 
por ̂
n
n  xi
lnL(X ,  )

1 i1
 0  xi  n  0  ˆ   x
   ˆ i1
 n
  ˆ
El estimador de máxima verosimilitud viene dado por la media muestral
EMV(ˆ )  x
Utilizando la muestra aleatoria de ocho intervalos de 10 minutos, se
obtiene el estimador máximo verosímil:
3587 4562
ˆ  5
8
En consecuencia, en una muestra aleatoria de ocho intervalos de 10
minutos cada uno, elegidos de forma independiente, la estimación
máxima verosímil corresponde a que la barrera se abre 5 veces.
b) Se analizan si los estimadores son o no insesgados, esto es, si la
esperanza del estimador coincide con el parámetro a estimar.
 n
xi  1
n
n
E(ˆ 1 )  E 
  
n  n  E(x i ) 
n

 i1 i1
 x  3x n  1   3
E(ˆ 2 )  E  1    E(x 1 )  3E(x 2 )  
 4  4 4
Ambos estimadores son insesgados.
Varianza de cada estimador:
 n
xi  1
n
n 
V(ˆ 1 )  V 
  
n  n2  V(x i )  
n2 n
 i1 i1

 x  3x n  1   9  10  5 
V(ˆ 2 )  V  1    V(x 1 )  9V(x 2 )   
 4  16 16 16 8
La efectividad de los estimadores depende del tamaño de la muestra:
 Si la muestra es igual a 1 (n  1) el estimador más eficiente es ̂ 2
 Si la muestra es mayor que 1 (n  1) el estimador más eficiente es ̂ 1
 Sea (x 1 ,  ,x n ) una muestra aleatoria de tamaño n, distribuida según
f(x, ) con  desconocido, donde X representa el tiempo máximo
necesario para determinar un proceso en segundos:
(  1)x  0  x  1 ;   1
f(X, )  
 0 otro caso
a) Determinar el estimador máximo verosímil de 
b) Determinar la estimación máximo verosímil de  en una muestra
aleatoria simple constituida por los datos:
0,7 0,9 0,6 0,8 0,9 0,7 0,9 0,8
Estimar la probabilidad del tiempo máximo necesario para terminar un
proceso, que no exceda de 0,25 segundos ni supere los 0,75 segundos.
2  1
c) Determinar el estimador máximo verosímil de: (a)   1 (b)
1
Solución:
n
a) Función de verosimilitud L()  L(X , )   f(x , )

i0
i
L(x 1 , x 2 , , x n ; )  (  1)x  (  1)x 


1

2  (  1)x 
n
  (  1) n
x
i0

i
 n
  n

ln L(x 1 , x 2 , , x n ; )  ln  (  1)n
  
x   ln(  1)n  ln 
 i
  x i 

 i0   i0 
n
ln L(x 1 , x 2 ,  , x n ; )  n ln(  1)    lnx

i0
i

Para obtener el estimador de máxima verosimilitud EMV(ˆ ) , se deriva
la expresión anterior respecto del parámetro para obtener, sustituyendo
 por ̂
ln L(x 1 , x 2 , , x n ; )
n n
 
n n
  lnx i  0    lnx i
   ˆ
ˆ
  1 i0
ˆ
  1 i0
n
ˆ  EMV()   n
1
 lnx
i0
i
b) El estimador máximo verosímil de  con los datos de la muestra:
8
ˆ   1
ln0,7  ln0,9  ln0,6  ln0,8  ln0,9  ln0,7  ln0,9  ln0,8
 4,027  1  3,027
El estimador máximo verosímil EMV()  ˆ  3,027

De otra parte,
ˆ 1 0 ,75

0,75 0,75 x
 
ˆ
P(0,25  X  0,75)  f(X, ˆ )dx  (ˆ  1)x  dx  (ˆ  1) 
0,25 0,25 ˆ
(  1) 0 ,25
ˆ 1 0,75

 x 0,25  0,75 4,027 ‐ 0,25 4,047  0,31
La probabilidad del tiempo máximo necesario para terminar el proceso
(entre 0,25 y 0,75 segundos) es 0,31
2  1
c) Estimador máximo verosímil de   1 y
1
EMV    1  EMV     1  ˆ  1  3,027  1  4,027
 2   1  2 EMV     1 2 ˆ  1 2 x 3,027  1
EMV      2,493
   1  EMV     1 ˆ  1 3,027  1

 En la distribución B(m, p) se considera como estimador del
x
parámetro p el estadístico p̂  , siendo x la media muestral en
m
muestras aleatorias simples de tamaño n. Hallar la eficiencia del
estimador.
Solución:
Un estimador es eficiente cuando su varianza coincide con la Cota de
ˆ  CCR
Cramer‐Rao V(p)
2
1   ln P(x ; p) 
CCR  I()  n.E   Información de Fisher
  ln P(x ; p) 
2
  
n.E  
  
ˆ  E   
x mp
Insesgadez: E(p) p
m m
El estimador es insesgado o centrado
Para determinar la CCR se considera la función de cuantía de la
 m
distribución binomial: P(x, p)    p x (1  p)m x
x
 m
lnP(x, p)  ln    x lnp  (m  x) ln(1  p)
x
lnP(x, p) x (m  x) (1  p)x  p(m  x) x  mp
   
p p 1p p(1  p) p(1  p)
2 2
 lnP(x, p)   x  mp  E(x  mp)
2
E
p   E  p(1  p)   p2 (1  p)2
   
En una distribución binomial: E(X)  mp , V(X)  E(X  mp)2  mp(1  p)
con lo que,

 x  mp  E(x  mp) m p (1  p)
2 2
 lnP(x, p) 
2
m
E   E  p(1  p)    
 p    p2 (1  p)2 p 2 (1  p) 2 p(1  p)
1 1 p(1  p)
CCR  2
 
  ln P(x ; p)  m nm
n.E  n
  p(1  p)
 
De otra parte, la varianza del estimador:
1 mp(1  p) p(1  p)
ˆ  V    2 V(x)  2
x 1
V(p) 
m m m n mn
Como la varianza del estimador coincide con la cota de Cramer‐Rao el
x
estadístico p̂  es eficiente.
m
 Una urna contiene bolas blancas y negras. Sea p la probabilidad de
extraer una bola blanca cuando se realiza una extracción al azar. Asociado
a este experimento aleatorio se encuentra la variable aleatoria X que
puede tomar los valores:
X = 1 si la bola extraída es blanca
X = 0 si la bola extraída es negra
Se selecciona una muestra aleatoria con reemplazamiento de tamaño 3
(x 1 , x 2 ,x 3 ) , siendo x i la variable aleatoria a la extracción i‐ésima, y se
supone que ha resultado la siguiente relación (B, N, B). Como el
parámetro p es desconocido se pretende saber, entre los valores, p  0,65
y p  0,73 qué valor hace más probable la aparición de dicha extracción.
Solución:
La distribución de probabilidad será una B(1; p): P(X  x)  p x (1  p) 1 x
Si la muestra (B, N, B) es independiente, siendo P(B)  p P(N)  1  p
P(B, N, B)  P(B  N  B)  P(B).P(N).P(B)  p.(1  p).p  p 2 . (1  p)

p  0,65 : P(B,N,B)  0,65 2 .0,35  0,1479

entonces 
 p  0,73 : P(B,N,B)  0,73 2 .0,27  0,1439

Resulta más probable (p = 0,65), siendo más verosímil.
Se considera la m.a.s. (x 1 , x 2 ,x 3 ) , siendo las variables aleatorias x i
independientes, tomando los valores 0, 1, con distribución B(1, p), la
distribución de probabilidad asociada será:
P(x 1 , p)  P(X  x 1 )  p x1 (1  p) 1  x1 

P(x 2 , p)  P(X  x 2 )  p x2 (1  p) 1  x2  x i  1, 0 seabola blanca o negra

P(x 3 , p)  P(X  x 3 )  p x3 (1  p) 1  x3 
Función de verosimilitud
3
L(p)   i1
P(x i , p)  p x1 (1  p) 1  x1 . p x2 (1  p) 1  x2 . p x3 (1  p) 1  x3 
x1x2x3 3  (x 1  x 2  x 3 )
 p (1  p)
En la muestra (B, N, B) el valor que toma la función de verosimilitud será:
L(p)  p 1  0  1 (1  p) 3  (1  0  1)  p 2 . (1  p)


Estim Adores

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estim Adores

Cargado por

Copyright:

Formatos disponibles

Gestión

ESTADÍSTICA TEÓRICA: ESTIMADORES

Estadística Teórica: Estimadores 1

a) EaX1  bX 2   EaX1   EbX 2   a E X1   b E X 2 

b) Var aX1  bX2   Var aX1   Var bX2   a2 Var  X1   b2 Var  X 2 

Estadística Teórica: Estimadores 3

Estadística Teórica: Estimadores 4

En el segundo miembro aparecen dos esperanzas, la primera E(x i  )2

Estadística Teórica: Estimadores 5

 Un estimador ̂ es insesgado (centrado) cuando E(ˆ )  

 Un estimador ̂ es sesgado sí E(ˆ )    b(ˆ )  b(ˆ )  E(ˆ )  

Estadística Teórica: Estimadores 6

El estimador ̂ es consistente cuando lim E(ˆ )   y lim V(ˆ )  0

Sean ̂ 1 y ̂ 2 dos estimadores insesgados, se dice que ̂ 1 es más

Estadística Teórica: Estimadores 7

Un estimador es asintóticamente eficiente sí: lim V(ˆ )  CCR

A la función ln L(X , ) se llama soporte o Log‐verosimilitud.

Estadística Teórica: Estimadores 8

P(x 1 , )  P(x n , ) caso discreto

Estadística Teórica: Estimadores 9

Estadística Teórica: Estimadores 10

Estadística Teórica: Estimadores 11

a) Un estimador ̂ es insesgado (o centrado) cuando se verifica E(ˆ )  

Estadística Teórica: Estimadores 12

Al ser los tres estimadores insesgados b(ˆ )  0  ECM(ˆ )  V(ˆ )

Estadística Teórica: Estimadores 13

Estadística Teórica: Estimadores 14

ˆ 1  f(0,367, x)  0,367 x 0,367  1  0,367 x  0 ,633

Estadística Teórica: Estimadores 15

Sesgo: b(ˆ 1 )  E(ˆ 1 )        0

Sean dos estimadores insesgados ̂1 y ̂2 de un parámetro desconocido

Estadística Teórica: Estimadores 16

El estimador ̂ 2 tiene menor varianza, por lo que es más eficiente que ̂1

Un estimador ̂ es consistente cuando lim E(ˆ )   y lim V(ˆ )  0

 lim E(ˆ 1 )  lim E(x)  

Estadística Teórica: Estimadores 17

Estadística Teórica: Estimadores 18

El primer estimador ̂1 será mejor sí

Estadística Teórica: Estimadores 19

b) Si ˆ 1  y ˆ 2  x 1  2x 2  3x 3  4 x 4  x 5 , obtener los pesos

E(ˆ 2 )  E(x 1  2x 2  3x 3  4 x 4  x 5 )  E(x 1 )  2E(x 2 )  3E(x 3 )  4E(x 4 )  E(x 5 ) 

Los estimadores ̂1 , ̂ 2 son insesgados (centrados).

Como los dos estimadores son insesgados y V(ˆ 1 )  V(ˆ 2 ) se elige como

Estadística Teórica: Estimadores 20

E(ˆ 2 )  E  8x 2  3x 5   8E(x 2 )  3E(x 5 )  8(  5)  3(  5)  5(  5)

Var( 2 )  Var  8x 2  3x 5   82 Var(x 2 )  32 Var(x 5 )  64  2  9  2  73  2

ECM(ˆ 1 )  V(ˆ 1 )   b(ˆ 1 )  5  2   4   25 

ECM(ˆ 2 )  V(ˆ 2 )   b(ˆ 2 )  73  2   4   25 

Estadística Teórica: Estimadores 21

El estimador ̂2 es insesgado, b(ˆ 2 )  0

Estadística Teórica: Estimadores 22

Estadística Teórica: Estimadores 23

Estadística Teórica: Estimadores 24

Estadística Teórica: Estimadores 25

ln L(X ,  )   x ln   ln(x !)  n

Para obtener el estimador de máxima verosimilitud EMV(ˆ ) , se deriva la

El estimador ̂ es insesgado (centrado) sí E(ˆ )  

Estadística Teórica: Estimadores 26

El estimador ̂ es consistente cuando lim E(ˆ )   y lim V(ˆ )  0

Estadística Teórica: Estimadores 27

 Sea la distribución N( , ) , con la media y varianza desconocidas.

Estadística Teórica: Estimadores 28

  ln(2 )  ln( 2 ) 

ln L(X;  ,  2 )   ln(2 )  ln( 2 ) 