Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2 Problemas Estimadores PDF
2 Problemas Estimadores PDF
Estadística Teórica II
1
1 2 2 (1,2,1) , (1,2,2) , (1,2,3)
3
1
3 2
3 (1,3,1) , (1,3,2) , (1,3,3)
1
2 2 2 (2,2,1) , (2,2,2) , (2,2,3)
3
1
3 2
3 (2,3,1) , (2,3,2) , (2,3,3)
1 (3,1,1) , (3,1,2) , (3,1,3)
1 2
3
1
3 2
3 (3,3,1) , (3,3,2) , (3,3,3)
xi P ( x = xi )
1 P ( x = 1) = 0,001
4/3 P ( x = 4 / 3) = 0,006
5/3 P ( x = 5 / 3) = 0,021 + 0,012 = 0,033
2 P ( x = 2 ) = 0,084 + 0,008 = 0,092
7/3 P ( x = 7 / 3) = 0,084 + 0,147 = 0,231
8/3 P ( x = 8 / 3) = 0,294
1 P ( x = 3) = 0,343
Muestras
posibles
xi = ∑ xi n ∑ x2i n σ2x i = ∑ x2i n − x2 Probabilidad
σ 2x P (σ 2x = σ 2x )
i i
0 P(σ 2
x
)
= 0 = 0,001 + 0,008 + 0,343 = 0,352
P(σ )
2/9 2
x = 2 / 9 = 0,006 + 0,012 + 0,084 + 0,294 = 0,396
P(σ = 2 / 3) =
2/3 2
x 0,084
P(σ = 8 / 9) =
8/9 2
x 0,021 + 0,147 = 0,168
xi P (x = x i ) x i . P (x = x i ) x i2 x i2 . P (x = x i )
1 0,001 0,001 1 0,001
4/3 0,006 4/3 . 0,006 16/9 16/9 . 0,006
5/3 0,033 5/3 . 0,033 25/9 25/9 . 0,033
2 0,092 2 . 0,092 4 4 . 0,092
7/3 0,231 7/3 . 0,231 49/9 49/9 . 0,231
8/3 0,294 8/3 . 0,294 64/9 64/9 . 0,294
3 0,343 3 . 0,343 9 9 . 0,343
E (x ) =∑ x i . P (x = x i ) = 2,6 ⎞
⎟
E (x ) = ∑ x 2i . P (x = x i ) = 6,9067
2 ⎟ muestra
⎟
⎟
V (x) = E (x 2 ) − (E (x)) 2 = 6,9067 − (2,6 ) 2 = 0,1467 ⎟⎠
μ = E(x) σ2 0,44
En consecuencia: Obsérvese que, σ2x = a 0,1467 =
σ2 ≠ V ( x ) = σ2
x
n 3
σ 2 2
= E (x ) − μ =2
7,2 − (2,6) 2 = 0,44 (varianza poblacional)
(3 − 1) (0,44) (n − 1) σ2
Se verifica la relación: E (σ2x ) = 0,2933 = =
3 n
2.- Se sabe que el peso de los jóvenes entre 14 y 18 años sigue una distribución normal
con media 50 kg y desviación típica 25 kg. Para llevar a cabo un estudio del control de
peso se seleccionan aleatoriamente 100 jóvenes cuyas edades se encuentran
comprendidas en el intervalo señalado. Si el peso medio muestral está entre 45 y 70 kg
se considera que están dentro de los límites normales. ¿Cuál es la probabilidad de que el
peso esté fuera de control?
Solución:
v. a. X = “ peso entre 14 y 18 años”
3.- Los barcos que hacen visitas guiadas por el Sena disponen de 60 asientos por barco
y una capacidad máxima de 4.200 kg por viaje. Los dueños de la empresa de barcos
saben por experiencia que los pesos de los turistas tienen una media de 71 kg y una
dispersión, medida a través de la desviación típica, de 10 kg.
a) ¿Cuál es la probabilidad de que un grupo de 60 turistas, escogidos aleatoriamente
en uno de los viajes, tenga un peso medio superior al total de la carga límite
permitida?
b) ¿Cuál sería el resultado si la varianza poblacional fuera desconocida?. (Suponga
que la desviación típica muestral es de 5 kg).
Solución:
⎛ x − 71 70 − 71 ⎞
P ( x > 70 ) = P ⎜⎜ > ⎟ = P ( z > − 0,77) = P ( z < 0,77) =
⎝ 1,29 1,29 ⎟⎠
= 1 − P ( z > 0,77) = 1 − 0,2206 = 0,7794
⎛ x − 71 70 − 71 ⎞
P ( x > 70 ) = P ⎜ ⎟ = P ( t59 > − 1,53) ⎯⎯ ⎯ ⎯→ P ( z > − 1,53) =
n > 30
>
⎜ 5 59 5 59 ⎟
⎝ ⎠
= P ( z < 1,53) = 1 − P ( z > 1,53) = 1 − 0,063 = 0,937
• Interpolando: P ( t59 > − 1,53) = P ( t59 < 1,53) = 1 − P ( t59 > 1,53) = 1 − 0,069 = 0,931
P ( t59 > − 1,53) = P ( t59 < 1,53) = 1 − P ( t59 > 1,53) = 1 − 0,069 = 0,931
0,14 . 0,05
x = 0,05 + = 0,069
0,37
Solución:
⎛ x − 71 70 − 71 ⎞
P ( x > 70 ) = P ⎜⎜ > ⎟ = P ( z > − 0,77) = P ( z < 0,77) =
⎝ 1,29 1,29 ⎟⎠
= 1 − P ( z > 0,77) = 1 − 0,2206 = 0,7794
⎛ x − 71 70 − 71 ⎞
P ( x > 70 ) = P ⎜ ⎟ = P ( t59 > − 1,53) ⎯⎯ ⎯ ⎯→ P ( z > − 1,53) =
n > 30
>
⎜ 5 59 5 59 ⎟
⎝ ⎠
= P ( z < 1,53) = 1 − P ( z > 1,53) = 1 − 0,063 = 0,937
• Interpolando: P ( t59 > − 1,53) = P ( t59 < 1,53) = 1 − P ( t59 > 1,53) = 1 − 0,069 = 0,931
0,14 . 0,05
x = 0,05 + = 0,069
0,37
x−μ x−μ
= ≈ tn −1 y es una cantidad pivotal para μ
σx sx
n−1 n
recordemos que n . σ2 = (n − 1) . s2
⎛ x − 71 70 − 71 ⎞⎟
P ( x > 70 ) = P ⎜ > = P ( t59 > − 1,5369) = P ( t59 < 1,5369) =
⎜ 5,04 60 5,04 60 ⎟⎠
⎝
= 1 − P ( t59 > 1,5369) = 1 − x = 1 − 0,06789 = 0,09321
0,1342 . 0,05
x = 0,05 + = 0,06789
0,375
5.- Se sabe por los datos censales que la variabilidad de la altura de alumnos de una
clase medida a través de la varianza es de 15,3. No obstante, para estudiar la
variabilidad en el muestreo de la varianza muestral se decide tomar una m.a.s. de 15
alumnos. ¿Cuál es la probabilidad de que la varianza muestral sea mayor que 15?
Nota: Suponer que la estatura es una variable aleatoria normalmente distribuida.
Solución:
σ2 ≡ varianza poblacional
σ2x ≡ varianza muestral
s2x ≡ cuasivarianza muestral
(
v.a. X =”estatura”: X ∈ N μ; 15,3 ≡ N ( μ; 3,91 ) )
n . σ2x n = 15 15 . σ2x
χn2−1 ≈ ⎯⎯ ⎯ ⎯ 2
⎯→ χ14 ≈
σ2 15,3
(
P σ2x > 15 )= ⎛ 15 . σ2 15 . 15 ⎞
P⎜
⎜ 15,3
x >
15,3 ⎟ 14 ( )
⎟ = P χ2 > 14,7 = 0,4835
⎝ ⎠
2
P χ14(> 14,7 = x ) 7,790 – 21,064
14,7 - 21,064
0,90 - 0,10
x – 0,10
13,274
6,364
0,80
x – 0,10
6,364 . 0,80
x = 0,10 + = 0,4835
13,274
(n − 1) . s2x n = 15 14 . s2x
De otra parte, χn2−1 ≈ 2
⎯⎯ ⎯ ⎯ 2
⎯→ χ14 ≈
σ 15,3
(
P s2x > 15 ) ⎛ 14 . s2
= P⎜
⎜ 15,3
x
>
14 . 15 ⎞⎟
15 ,3 ⎟
2
= P χ14 ( )
> 13,725 = 0,5423
⎝ ⎠
6.- Se desea analizar las diferencias de las calificaciones entre dos grupos de alumnos.
Unos proceden del Grupo b1 y otros del Grupo b2. Para estudiar la distribución en el
muestro de la diferencia de medias se toman m.a.s. independientes de ambas
poblaciones obteniéndose la siguiente tabla:
Grupo b1 Grupo b2
Tamaño de la población 200 150
Tamaño de la muestra 100 75
Media de la población 4,10 5,18
Media de la muestra 4,2153 5,3247
Desviación típica de la población 1,55 1,95
Desviación típica de la muestra 1,5635 1,8238
¿Cuál es la probabilidad de que la diferencia de medias muestrales sea mayor que uno?
Solución:
v.a. X =”calificación del Grupo b1” X ∈ N(4,10 , 1,55)
v.a. Y =”calificación del Grupo b2” Y ∈ N (5,18 , 1,95)
⎡ ⎤
Con lo cual, (x − y) ∈ N ⎢( 4,10 − 5,18 ); 0,155 2 + 0,225 2 ⎥ ≡ N ( − 1.08 ; 0,2732)
⎣ ⎦
(
P x − y >1 ) = P [ (x − y ) > 1] + P [ (x − y ) < − 1] =
⎡ 1 + 1,08 ⎤ ⎡ − 1 + 1,08 ⎤
= P ⎢z > ⎥ + P ⎢z < = P (z > 7,61) + P [ z < 0,2928] =
⎣ 0,2732 ⎦ ⎣ 0,2732 ⎥⎦
= 0 + [ 1 − P ( z > 0,2928 ) ] = 1 − 0,3859 = 0,6141
o también,
P ( x − y >1 =1−P) ( )
x − y < 1 = 1 − P (− 1 < (x − y) < 1 ) =
7.- Un concesionario vende dos tipos de vehículos, unos de gama alta y otros de gama
media. Los coches de gama alta suponen el 30% del total de los coches vendidos. ¿Cuál
es la probabilidad de que entre los 100 últimos vehículos vendidos más del 35% sean de
gama alta?
Solución:
La variable poblacional
X = 'venta de coches gama
alta' es una variable
binomial B(100; 0,3), que
sigue aproximadamente una
distribución normal tal que
X ∈ N (np ; npq )
Interpolando:
0,0022 . 0,0083
x = 0,1357 + = 0,1375
0,01
8.- Se sabe que los sábados por la noche un 70% de los conductores superan la tasa de
alcoholemia permitida por la ley. Sin embargo esta cifra se reduce a un 40% los
domingos por la noche. Durante un fin de semana, se quiere realizar un control de
alcoholemia y comparar los resultados de los dos días. Se decide elegir al azar 40
vehículos de los que circulan el sábado por la noche y 35 del domingo. Calcular la
probabilidad de que la proporción muestral de conductores que superan la tasa de
alcoholemia permitida por la ley haya descendido más de un 10% del sábado al domingo.
Solución:
⎛ ⎛p x qx ⎞ ⎛p y qy ⎞ ⎞
[ p̂ x ± p̂ y ] ∈ N ⎜⎜ [ p x ± p y ] ; ⎜
⎜ nx
⎟+⎜
⎟ ⎜ ny
⎟
⎟
⎟
⎟
⎜ ⎝ ⎠ ⎝ ⎠ ⎟
⎝ ⎠
⎛ ⎞
[ p̂ x − p̂ y ] ∈ N ⎜⎜ [ 0,7 − 0,4] ; ⎛ 0,7 . 0,3 ⎞ ⎛ 0,4 . 0,6 ⎞
⎜ ⎟+⎜ ⎟ ⎟ ≡ N (0, 3 ; 0,11)
⎟
⎝ ⎝ 40 ⎠ ⎝ 35 ⎠ ⎠
⎛ 0, 1 − 0,3 ⎞
P ( p̂ x − p̂ y > 0, 1) = P ⎜⎜ z > ⎟ = P ( z > − 1,82) = 1 − P ( z > 1,82) = 1 − 0,0344 = 0,9656
⎝ 0, 11 ⎟⎠
Solución:
⎛ ⎛p x qx ⎞ ⎛p y qy ⎞ ⎞
[ p̂ x ± p̂ y ] ∈ N ⎜⎜ [ p x ± p y ] ; ⎜
⎜ nx
⎟+⎜
⎟ ⎜ ny
⎟
⎟
⎟
⎟ siendo las muestras: nx = 50 , ny = 60
⎜ ⎝ ⎠ ⎝ ⎠ ⎟
⎝ ⎠
⎛ ⎞
[ p̂x − p̂y ] ≈ N ⎜⎜ [ 0,8 − 0,55] ; ⎛ 0,8 . 0,2 ⎞ ⎛ 0,55 . 0,45 ⎞
⎜ ⎟+⎜ ⎟ ⎟ ≡ N (0, 25 ; 0, 0856)
⎟
⎝ ⎝ 50 ⎠ ⎝ 60 ⎠ ⎠
[ ] ⎛
P ( p̂x − p̂ y ) < 0, 20 = P ⎜⎜ z <
⎝
0, 2 − 0,25 ⎞
0, 0856 ⎟⎠
⎟ = P (z < − 0,58) = P (z > 0,58) = 0,2810
[ ]
Como la P ( p̂x − p̂ y ) > 0, 20 = 1 − 0,2810 = 0,719 es bastante probable, se aconsejaría
sacar el producto del mercado.
10.- La variable aleatoria poblacional "renta de las familias" del municipio de Madrid se
distribuye siguiendo un modelo N (μ, σ2 ) . Se extraen muestras aleatorias simples de
tamaño 4. Como estimadores del parámetro μ, se proponen los siguientes:
x1 + 2x 2 + 3x 3
μ1 =
ˆ
6
x3 − 4x 2
μ2 =
ˆ
−3
μ3 = x
ˆ
Se pide:
a) Comprobar si los estimadores son insesgados
b) ¿Cuál es el más eficiente?
c) Si tuviera que escoger entre ellos, ¿cuál escogería?. Razone su respuesta a partir
del Error Cuadrático Medio.
Solución:
E (ˆ
⎡ x1 + 2x 2 + 3x 3⎤
μ 1) = E ⎢
6
⎥ =
1
6
[
E x1 + 2x 2 + 3x 3 = ]
⎣ ⎦
=
1
6
[
E ( x 1) + 2 E ( x 2 ) + 3 E ( x 3 ) = ]
1
6
[6μ ] = μ
E (ˆ
⎡ x1 − 4x 2⎤
μ 2) = E ⎢
− 3
⎥ = −
1
3
[
E x1 − 4x2 ] = −
1
3
[
E ( x 1) − 4 E ( x 2 ) = ]
⎣ ⎦
1
= − [ − 3μ ] = μ
3
E (ˆ
⎡ x1 + x2 + x3 + x 4⎤
μ 3) = E ⎢
4
⎥ =
1
4
[
E x1 + x2 + x3 + x 4 = ]
⎣ ⎦
=
1
4
[
E ( x 1) + E ( x 2 ) + E ( x 3 ) + E ( x 4 ) =
1
4
]
[4μ ] = μ
[ ]
μ1
V ˆ = V⎢
⎡ x1 + 2x 2 + 3x 3 ⎤
6
⎥ =
1
36
[
V x1 + 2x 2 + 3x 3 = ]
⎣ ⎦
=
1
36
[
V ( x 1) + 4 V ( x 2 ) + 9 V ( x 3 ) =
1
36
]14 σ 2 =
14 2
36
[
σ = 0,39 σ 2 ]
[ ]
μ2
V ˆ = V⎢
⎡ x1 − 4x2⎤
−3
⎥ =
1
9
V x1 − 4x2[ ] =
1
9
[ V ( x 1) + 16 V ( x 2 ) ] =
⎣ ⎦
=
1
9
[
17 σ 2 =
9
]
17 2
σ = 1,89 σ 2
[ ]
V ˆ
μ3
⎡ x1 + x2 + x3 + x 4⎤
= V⎢
4
⎥ =
1
16
[
V x1 + x2 + x3 + x 4 = ]
⎣ ⎦
=
1
16
[
V ( x 1) + V ( x 2 ) + V ( x 3 ) + V ( x 4 ) =
1
16
]
4σ 2 =
4 2
16
[
σ = 0,25 σ 2 ]
El estimador μ̂ 3 es el más eficiente.
2
⎡ ⎤
ECM (ˆ
θ) = E (ˆ
θ − θ) 2
= V (ˆ
θ) + ⎢E (ˆ
θ) − θ ⎥
⎢ 1424 3⎥
sesgo b (ˆ
θ) = E (ˆ [
θ) − θ ]
⎢⎣ sesgo ⎥⎦
Si E14
(ˆ
θ2
)=
4
ˆ ˆ
3θ ⇒ ECM (θ) = V (θ)
insesgado
Como los tres estimadores son insesgados (centrados), me decido por el que
menor varianza presenta, puesto que coincidirá con el que menor ECM tiene, es
decir, escojo el estimador μ̂ 3
11.- La variable aleatoria X representa los gastos mensuales de una empresa, cuya
función de densidad es f (θ, x) = θ x θ − 1 con θ > 0 y 0 < x < 1 . Se realiza una m.a.s. de
tamaño 3, y se proponen tres estimadores:
ˆ
θ1 = x
x 12 + 2 x 2 2
2 + 3x 3
ˆ
θ2 =
6
x 3 − 2x1 + 4x 2
ˆ
θ3 =
6
a) Calcule los sesgos
b) Si la muestra que se obtiene es (0,7 ; 0,1 ; 0,3), calcule las estimaciones
puntuales.
c) ¿Cuáles son las funciones estimadas para las estimaciones anteriores?
Solución:
ˆ
θ 1 = x ⇒ E (ˆ
⎡x 1 + x 2 + x 3 ⎤
θ 1) = E ⎢
3
⎥=
1
3
[
E x1 + x2 + x3 =
1
3
]
(3 μ) = μ (media poblacional)
⎣ ⎦
1
∞ 1 1 1 ⎡ θ x θ +1 ⎤ θ
donde μ = ∫ − ∞ x f (x, θ) dx = ∫ 0 x f (x, θ) dx = ∫ 0 x θ x θ − 1 dx = ∫ 0 θ x θ dx = ⎢ ⎥ =
⎣⎢ θ + 1 ⎦⎥ 0 θ+1
θ θ2
El sesgo: b (ˆθ1 ) = E (ˆθ1 ) − θ = −θ= −
θ+1 θ+1
x 12 + 2 x 2 2
2 + 3x 3
• Sesgo del estimador ˆθ 2 =
6
⎡x 2 + 2x 2 + 3x 2 ⎤ ⎡ ⎤
⎢ 1 2 3⎥ 1 ⎢ 2 2 2 ⎥ 1
E (ˆ
θ 2) = E ⎢ ⎥ = ⎢ E (x 1 ) + 2 E (x 2 ) + 3 E (x 3 ) ⎥= (6 α2 ) = α2 (∗)
6 6 ⎢ 123 123 123 ⎥ 6
⎢⎣ ⎥⎦
⎣ α2 α2 α2 ⎦
entonces,
⎡x 2 + 2 x 2 + 3 x 2 ⎤ ⎡ ⎤
⎢ 1 2 3⎥ 1 ⎢ 2 2 2 ⎥ θ
E (ˆ
θ 2) = E ⎢ ⎥ = ⎢ E (x 1 ) + 2 E (x 2 ) + 3 E (x 3 ) ⎥ = α2 =
6 6 ⎢ 123 1 2 3 1 2 3 ⎥ θ+2
⎢⎣ ⎥⎦
⎣ α2 α2 α2 ⎦
x 3 − 2x1 + 4x2
• Sesgo del estimador ˆθ 3 =
6
E (ˆ
⎡x 3 − 2 x 1 + 4 x 2 ⎤
θ 3) = E ⎢
6
⎥=
1
6
E x3 − 2x1 + 4x 2 =
1
6
[
(3 μ) =
1
2
μ ]
⎣ ⎦
1
∞ 1 1 θ−1 1 θ
⎡ θ x θ +1 ⎤ θ
μ= ∫ −∞
x f (x, θ) dx = ∫ 0
x f (x, θ) dx = ∫ 0
x θx dx = ∫ 0
θ x dx = ⎢
⎢⎣ θ + 1
⎥ =
⎥⎦ 0 θ+1
1 ⎛ θ ⎞ 2θ2 + θ
El sesgo: b (ˆθ3 ) = E (ˆθ3 ) − θ = ⎜⎜ ⎟⎟ − θ = −
2 ⎝ θ + 1⎠ 2 (θ + 1)
b) Si la muestra que se obtiene es (0,7 ; 0,1 ; 0,3), calcule las estimaciones puntuales.
ˆ 0, 7 + 0, 1 + 0, 3
θ1 = = 0, 367
3
ˆ 0, 7 2 + 2 . 0, 1 2 + 3 . 0, 3 2
θ2 = = 0, 13
6
ˆ 0, 3 − 2 . 0, 7 + 4 . 0, 1
θ3 = = − 0, 117 a no puede ser, puesto que ˆ
θ> 0
6
12.- Sea una población con media μ de la que se extraen m.a.s. de tamaño n. Considere
los siguientes estimadores de la media:
n
1
μ1 = x
ˆ μ2 =
ˆ
n+1
∑xi
i =1
a) Estudie la insesgadez, la eficiencia relativa y la consistencia de ambos
estimadores.
b) Elija uno de los dos en término del error cuadrático medio.
Solución:
a) Insesgadez
1 n 1 n
1 n
1
E (ˆ
μ 1 ) = E (x) = E ( ∑
n i=1
x i) =
n
E ( ∑ x i) =
n
∑ E (x i ) =
n
(n μ) = μ
i=1 i=1
b (ˆ
μ 1 ) = E (ˆ
μ 1) − μ = μ − μ = 0
1 n 1 n
1 n
1 nμ
E (ˆ
μ 2) = E( ∑
n + 1 i=1
x i ) =
n+1
E ( ∑ x i) =
n+1
∑ E (x i ) =
n+1
(n μ) =
n+1
i=1 i=1
• Eficiencia
1 n 1 n 1 2 σ2
V (ˆ
μ 1 ) = V (x ) = V ( ∑ x i) = ∑ V (x i ) = ( n σ ) =
n i=1 n 2 i=1 n2 n
1 n 1 n
1 n
V (ˆ
μ 2) = V ( ∑ x i ) = 2 ∑ V (x i ) = 2
(n σ 2) = σ2
n + 1 i=1 (n + 1) i=1 (n + 1) (n + 1) 2
• Consistencia
⎧ ⎛ 1 ⎞
⎪ lim E (ˆ
μ 2 ) = lim ⎜ μ − μ⎟ = μ
⎪ n→ ∞ n→ ∞ ⎝ n+1 ⎠
μ2
ˆ ≡ ⎨ ⎡ ⎤ es consistente
n
⎪ lim V (ˆ
μ 2 ) = lim ⎢ σ 2⎥ = 0
⎪n → ∞ n → ∞ ⎣⎢ (n + 1) 2 ⎦⎥
⎩
σ2 σ2
μ 1 ) = V (ˆ
ECM (ˆ μ 1) + [ b (ˆμ 1)] 2 = n
+0=
n
2
nσ 2 + μ 2
ECM (ˆ
μ 2 ) = V (ˆ
μ 2) + [ b (ˆμ 2 )] 2 = n ⎛ 1
σ2 + ⎜
⎞
μ⎟ =
(n + 1) 2 ⎝n+1 ⎠ (n + 1) 2
En esta línea,
σ2 nσ 2 + μ 2 nσ 2 μ2 σ2 nσ 2 μ2
≤ = + ⇒ − ≤ ⇒
n (n + 1) 2 (n + 1) 2 (n + 1) 2 n (n + 1) 2 (n + 1) 2
2n + 1 2n + 1 μ2
⇒ σ2 ≤ μ2 ⇒ ≤
n n σ2
⎧ 2n + 1 μ2
⎪Si ≤ μ 1 se elige antes que ˆ
a ˆ μ2
⎪⎪ n σ2
⎨
⎪ 2n + 1 μ2
⎪Si ≥ μ 2 se elige antes que ˆ
a ˆ μ1
⎪⎩ n σ2
13.- El peso en kilos de los jamones vendidos por una empresa sigue una distribución
normal con varianza 4 y peso medio desconocido. Se conoce que el peso medio de los
jamones vendidos es superior a 5 kg, y se toman m.a.s. de tamaño 4 para estimar θ .
¿Cuál de los dos estimadores sería el mejor respondiendo a la insesgadez y eficiencia?
X1 + X2 + X3 X1 + X2
ˆ
θ1 = ˆ
θ2 =
4 2
Solución:
La v.a X i =' peso en kg de los jamones' sigue una distribución normal de varianza 4
Para estudiar la insesgadez de los estimadores hallamos sus esperanzas:
• E (ˆ
⎡X 1 + X 2 + X 3 ⎤
θ 1) = E ⎢
4
⎥=
1
4
[
E (X 1 ) + E (X 2 ) + E (X 2 ) =
3
4
θ]
⎣ ⎦
3 1
El sesgo del estimador θ̂ 1 será: b (ˆθ 1) = E (ˆθ 1) − θ = θ − θ = − θ
4 4
• E (ˆ
⎡X 1 + X 2 ⎤
θ 2) = E ⎢
2
⎥=
1
2
[
E (X 1 ) + E (X 2 ) ] =
2
2
θ = θ
⎣ ⎦
⎡ ⎤
⎢ ⎥ V (X i ) = 4
}
V (ˆ
⎡X 1
θ 2) = V ⎢
+ X2⎤
2
⎥ =
1 ⎢
⎢ V (X 1 + X 2 ) ⎥ =
4 ⎢ 1442443 ⎥
⎥ 1
4
[ V (X 1) + V (X 2 ) ] =
1
4
8 = 2
⎣ ⎦
⎢ las observaciones ⎥
⎣⎢ son independientes ⎦⎥
⎧ 3 ⎛ θ ⎞
2
θ 2 + 12
⎪ECM (ˆθ 1) = + ⎜− ⎟ =
⎪ 4 ⎝ 4 ⎠ 16
⎪
ECM = Varianza + (sesgo) 2 ≡ ⎨
⎪ ECM (ˆ
θ 2) = 2 + 0 = 2
⎪
⎪⎩
Se analiza cuando es mayor el ECM del primer estimador θ̂ 1 : ECM(ˆθ 1) > ECM (ˆθ 2 )
θ 2 + 12
> 2 ⇒ θ 2 > 20 ⇒ θ > 20 ≈ 4,47
16
Si θ es en valor absoluto mayor que 4,47, el error cuadrático medio de θ̂ 1 es mayor, con
lo que se elige el estimador θ̂ 2 .
Como sabemos que el peso medio de los jamones es superior a 5 kg, no queda duda que
el estimador a elegir (con menor error cuadrático medio) es θ̂ 2 .
a) Analizar cuál de los estimadores μ̂ 1 , μ̂ 2 del peso medio es mejor respecto del
sesgo y de la eficiencia, para una muestra aleatoria simple de tamaño cinco.
5
∑Xi
b) Si ˆ
μ1 = i=1
y μ 2 = X1 + 2X 2 + 3X 3 − 4X 4 − X 5 ,
ˆ obtener los pesos medios
5
estimados a partir de la siguiente muestra (125, 135, 130, 137, 142).
Solución.-
Calculamos las esperanzas de los estimadores para analizar el sesgo de los estimadores
E (X i) = μ
⎡5 ⎤ 1 ⎡5 ⎤ 5 }
∑ E [ X i]
1 1
E (μ̂ 1) = E ⎢ ∑ X i 5⎥ = E ⎢∑ X i ⎥ = = (5 μ) = μ
⎣⎢i=1 ⎦⎥ 5 ⎢⎣i=1 ⎦⎥ 5 i =1 5
E (μ̂ 2) = E (X 1 + 2 X 2 + 3 X 3 − 4 X 4 − X 5) = E (X 1) + 2 E ( X 2) + 3 E ( X 3) − 4 E ( X 4) − E ( X 5) =
= μ + 2μ + 3μ − 4μ − μ = μ
V (X i ) = 7 2
⎡5 ⎤ ⎡5 ⎤ 5
∑ V [X i ]
1 1 } 1 49
μ 1) = V ⎢ ∑ X i 5⎥ =
V (ˆ V ⎢∑ X i ⎥ = = (5 . 49) =
⎣⎢i=1 ⎥⎦ 25 ⎣⎢i=1 ⎦⎥ 25 i=1 25 5
V (μ̂ 2) = V (X 1 + 2 X 2 + 3 X 3 − 4 X 4 − X 5) = V (X 1) + 4 V ( X 2) + 9 V ( X 3) + 16 V ( X 4) + V ( X 5) =
= (49) + 4 (49) + 9 (49) + 16 (49) + (49) = 31 (49) = 1519
n 1 n 1 n 1 n
μ 1) = E (∑ X i n − 1) =
E (ˆ E (∑ X i ) = ∑ E (X i) = (n μ) = μ
i=1 n − 1 i=1 n−1 i=1 n−1 n−1
n 1
El sesgo del estimador μ̂ 1 será: b (ˆ
μ 1 ) = E (ˆ
μ 1) − μ = μ −μ= μ
n−1 n−1
n 1 n 1 n 1
μ 2 ) = E (∑ X i n) =
E (ˆ E (∑ X i ) = ∑ E (X i) = n (n μ) = μ
i=1 n i=1 n i=1
n
1 n
1 n
1 nσ 2
μ 1) = V (∑ X i
V (ˆ n − 1) = V (∑ X i ) = ∑ V (X i ) = (n σ 2 ) =
i =1 (n − 1) 2 i =1 (n − 1) 2 i =1 (n − 1) 2 (n − 1) 2
n 1 n 1 n 1 σ2
μ 2 ) = V (∑ X i n) =
V (ˆ V (∑ X i ) = ∑ V (X i) = (n σ 2 ) =
i=1 n2 i=1 n i=1 n2 n
El estimador más eficiente será el de menor varianza. Comparando las varianzas de los
estimadores:
σ2 nσ 2
V (ˆ
μ 2) = < = V (ˆ
μ 1) puesto que (n − 1) 2 < n 2
n (n − 1) 2
16.- Una urna contiene bolas blancas y negras. Sea p la probabilidad de extraer una
bola blanca cuando se realiza una extracción al azar. Asociado a este experimento
aleatorio tenemos la variable aleatoria X que puede tomar los valores:
Solución.-
⎧ P(B) = p
Si la muestra (B, N, B) es independiente, siendo ⎨
⎩P(N) = 1 − p
3
x 1− x1 x 1−x2 x 1− x3
L (p) = ∏ P (x i , p) = p 1 (1 − p) . p 2 (1 − p) . p 3 (1 − p) =
i =1
x +x2 +x3 3 − ( x 1 + x 2 + x 3)
= p 1 (1 − p)
L (p) = p 1 + 0 + 1 (1 − p) 3 − ( 1 + 0 + 1) = p 2. (1 − p)
Solución.-
a)
λx − λ ⎧ E (X) = λ
En la distribución de Poisson: P (X = x) = e ⎨
x! ⎩ V (X) = λ
x x
∑xi
n
λ 1 −λ λ n −λ λ i=1
L (λ ) = L (X , λ ) = ∏ P (x i, λ) = e L e = n e− n λ
i=1 x 1! x n!
∏ x i!
i=1
n ⎡ n ⎤ n
∑xi ⎢ ∑xi ⎥
λ i =1 ⎢λ i =1 ⎥ ∑ xi n
−nλ −nλ
L (X , λ) = n e ⇒ ln L (X , λ ) = ln ⎢ n e ⎥ = ln (λ i =1 ) − ln (∏ x i !) + ln (e − n λ ) =
⎢ ⎥ i=1
∏ x i! ⎢∏ x i! ⎥
i=1 ⎣⎢ i =1 ⎦⎥
n n
= ∑ x i Ln λ − ∑ Ln (x i !) − nλ
i=1 i=1
Lo que nos dice que el Estimador de Máxima Verosimilitud (EMV) del parámetro λ
vendría dado por la media muestral: EMV (λ) = x
• Insesgadez
• Eficiencia
Para que un estimador sea eficiente tiene que ser centrado y de varianza mínima.
La varianza mínima se analiza en virtud de la acotación de Cramer-Rao:
1
V (ˆ
λ) ≥ 2
acotación de Cramer - Rao
⎡ ϑ ln f(x , λ ) ⎤
n E⎢ ⎥
⎣ ϑλ ⎦
λx − λ
Ahora bien, f (x , λ) = e
x!
⎡ λx − λ ⎤
ln f (x , λ) = ln ⎢ e ⎥ = x ln λ − ln (x !) − λ
⎢⎣ x ! ⎥⎦
ϑ ln f (x , λ) x x−λ
= − 1 =
ϑλ λ λ
2 2
⎡ ϑ ln f (x , λ) ⎤ ⎡x − λ ⎤ 1 1 1 λ 1
E⎢ ⎥ = E⎢ ⎥ = 2
E (x − λ) 2 = 2
E (x − x) 2 = 2
V (x) = 2
=
⎣ ϑλ ⎦ ⎣ λ ⎦ λ λ λ λ λ
1 λ
En consecuencia, V (ˆ
λ) ≥ =
1 n
n
λ
El resultado nos dice que el menor valor de la varianza del estimador sería λ n .
λ
ˆ
λ = x (calculado por el EMV). Sabemos V (x) = , lo que muestra que el estimador
n
empleado es eficiente.
• Consistencia
lim E (ˆ
λ) = lim λ = λ
n→ ∞ n→ ∞
λ
lim V (ˆ
λ) = lim =0
n→ ∞ n→ ∞ n
El estimador λ̂ es consistente
Solución.-
(
L(p) = (1 − p) 9 p ) ( (1 − p) 14 p ) ( (1 − p) 17 p ) = (1 − p) 40 p 3
(
log [ L(p)] = log (1 − p) 40 p 3 ) = log (1 − p) 40
+ log p 3 = 40 log (1 − p) + 3 log p
log [ L(p)] − 40 3 3
= + =0 a p̂ =
dp 1−p p 43
Solución.-
( )
log L(p, q) = log p 450 (1 − p) 550 q 350 (1 − q) 650 = 450 log p + 550 log (1 − p) + 350 log q + 650 log (1 − q)
La variable aleatoria X = "número de mujeres con ojos oscuros, entre 8" sigue una
distribución binomial B (n = 8 ; p = 0,24)
⎛ 8⎞
P(X ≥ 1) = 1 − P(X = 0) = 1 − ⎜⎜ ⎟⎟ (0,24) 0 (0,76) 8 = 0,89
⎝ 0⎠
⎛ Y − 48 60 − 48 ⎞
P(Y > 60) = P⎜⎜ > ⎟ = P(z > 1,99) = 0,0233
⎝ 6,04 6,04 ⎟⎠
Solución.-
La función de verosimilitud
n
−a ∑xi
L = L (x 1, x 2 , L , x n ; a) = (a 2 e − a x1 ) . (a 2 e − a x2 ) L (a 2 e − a xn ) = a 2 n e i=1
n
−a ∑xi n
aplicando logaritmos neperianos: log L = log (a 2 n e i=1
) = 2 n log a − a ∑ x i
i=1
derivando respecto de 'a' e igualando a cero:
d (log L) 2 n n 2n 2 2
= − ∑ x i = 0 ⇒ â = = â =
da a i=1 n x x
∑ xi
i=1
d (log L) 2 2 1
= − (x1 + x2 ) = 0 ⇒ â = =
da a x1 + x2 x
Solución.-
⎡ (x1 − μ) 2 ⎤ ⎡ (x 2 − μ ) 2 ⎤ ⎡ (x n − μ ) 2 ⎤
⎢ − ⎥ ⎢ − ⎥ ⎢ − ⎥
1 2 σ2 1 2 σ2 1 2 σ2
L (X; μ, σ 2 ) = ⎢ e ⎥ ⎢ e ⎥ L ⎢ e ⎥ =
⎢ 2 π σ2 ⎥ ⎢ 2 π σ2 ⎥ ⎢ 2 π σ2 ⎥
⎣⎢ ⎦⎥ ⎣⎢ ⎦⎥ ⎢⎣ ⎥⎦
n
2
∑ (xi − μ)
− i=1
1 2 σ2
= e
n n
2 2 2
(2 π) (σ )
⎡ n
∑ (xi − μ)
2⎤
n
⎢ ⎥ (xi − μ)2
i=1 ∑
[ ]
⎢ − ⎥
1 2 n n
log L (X; μ, σ 2 ) = log ⎢ n n
e 2 σ 2
⎥ = − log (2 π) − log (σ ) − i =1
⎢ ⎥ 2 2 2 σ2
2 2 2
⎢ (2 π) (σ ) ⎥
⎢⎣ ⎥⎦
n
[ ]= −
2
2 ∑ (xi − μ)
d log L (X; μ, σ ) n
+ i=1 =0
2 2
dσ 2σ 2σ4
n
2
∑ (xi − μ)
como σ 2 > 0 , el estimador máximo verosímil de σ 2 será: σ 2 = i =1
ˆ
n
Solución.-
⎡ (x1 − μ) 2 ⎤ ⎡ (x 2 − μ ) 2 ⎤ ⎡ (x n − μ ) 2 ⎤
⎢ − ⎥ ⎢ − ⎥ ⎢ − ⎥
1 2 σ2 1 2 σ2 1 2 σ2
L (X; μ, σ 2 ) = ⎢ e ⎥ ⎢ e ⎥ L ⎢ e ⎥ =
⎢ 2 π σ2 ⎥ ⎢ 2 π σ2 ⎥ ⎢ 2 π σ2 ⎥
⎣⎢ ⎦⎥ ⎣⎢ ⎦⎥ ⎢⎣ ⎥⎦
n
2
∑ (xi − μ)
− i =1
1 2 σ2
= e
n n
2 2 2
(2 π) (σ )
⎡ n
∑ (xi − μ)
2⎤
n
⎢ ⎥ (xi − μ)2
i=1 ∑
[ ]
⎢ − ⎥
1 2 n n
log L (X; μ, σ 2 ) = log ⎢ n n
e 2 σ 2
⎥ = − log (2 π) − log (σ ) − i =1
⎢ ⎥ 2 2 2 σ2
2 2 2
⎢ (2 π) (σ ) ⎥
⎢⎣ ⎥⎦
n
[
ϑ log L (X; μ, σ )
= i=1
2
] ∑ (xi − μ)
=0
ϑμ σ2
n
[ ]= −
2
∑ (xi − μ)
ϑ log L (X; μ, σ 2 ) n
+ i=1 =0
2 2
ϑσ 2σ 2σ4
n
2
∑ (xi − x)
resolviendo el sistema resulta: μ=x y
ˆ σ 2 = i =1
ˆ = σ 2x
n
1− θ ⎫
P (ξ = −1) = ⎪
2 ⎪
θ+λ ⎪ 0< θ<1
P (ξ = 0) = ⎬
2 ⎪ 0< λ <1
1− λ ⎪
P (ξ = 1) = ⎪
2 ⎭
Solución.-
Puesto que hay que estimar dos parámetros hay que calcular los dos primeros
momentos.
644444444444444444momentos 444447 poblaciona les
4444444444444444444444 8
⎛1 − θ ⎞ ⎛θ + λ⎞ ⎛1 − λ ⎞ θ−λ
α 1 = μ = E(ξ) = ∑ x i P(ξ = x i ) = (−1) ⎜ ⎟ + (0) ⎜ ⎟ + (1) ⎜ ⎟ =
i ⎝ 2 ⎠ ⎝ 2 ⎠ ⎝ 2 ⎠ 2
⎛1 − θ ⎞ ⎛θ+ λ⎞ ⎛1 − λ ⎞ 2− θ−λ
α 2 = E(ξ 2 ) = ∑ x i2 P(ξ = x i ) = (−1) 2 ⎜ ⎟ + (0) 2 ⎜ ⎟ + (1) 2 ⎜ ⎟ =
i ⎝ 2 ⎠ ⎝ 2 ⎠ ⎝ 2 ⎠ 2
6444momentos
44447muestrales
44444448
∑xi ∑ x i2
a1 = x = i a2 = i
n n
• Insesgadez
⎛2 − θ − λ ⎞ ⎛θ− λ⎞
E (ˆ
θ) = E ( 1 − a 2 + x) = 1 − E (a 2 ) + E (x) = 1 − α 2 + μ = 1 − ⎜ ⎟+ ⎜ ⎟ = θ
⎝ 2 ⎠ ⎝ 2 ⎠
⎛2 − θ − λ ⎞ ⎛θ− λ⎞
E (ˆ
λ ) = E ( 1 − a 2 − x) = 1 − E (a 2 ) − E (x) = 1 − α 2 − μ = 1 − ⎜ ⎟− ⎜ ⎟ = λ
⎝ 2 ⎠ ⎝ 2 ⎠
Solución.-
a)
⎪⎪
θ 1 n [1 n ]
⎧ P (x , L , x ) = g θ̂ (x , L , x ) , θ . h (x , L , x )
1 n caso discreto
⎨
1 n [ 1 n ]
⎪ f (x , L , x ) = g θ̂ (x , L , x ) , θ . h (x , L , x )
⎪⎩ θ 1 n caso continuo
θ −1 θ −1 θ − 1 ) = θ n (x L x ) θ − 1
L (θ) = f θ (x 1) f θ (x 2) L f θ (x n) = (θ x ) (θ x ) L (θ x n 1 n
1 2
b) L (θ) = θ n (x 1 L x n ) θ − 1
n n
θ −1 θ −1
ln L (θ) = ln ⎛⎜ θ n (x 1 L x n ) θ − 1 ⎞⎟ = ln θ n + ln ∏ x = ln θ n + ∑ ln ( x i )
⎝ ⎠ i
i=1 i =1
n ϑ ln L (θ) n n n
ln L (θ) = n ln θ + (θ − 1) ∑ ln (x i) ⇒ = + ∑ x i = 0 a θ̂ = −
i=1 ϑθ θ i=1 n
∑ ln (x i)
i=1
ˆ x
x (θ + 1) = θ ⇒ θ =
1− x
Solución.-
E (ˆ
θ) = E ( x − 1 ) = E ( x ) − 1 = ( θ + 1 ) − 1 = θ
⎧
−x+θ −x+θ −x+θ −x+θ
⎪∫x { e
14243 dx = x 1e4243) − ∫ −
{ (− 1e4243 dx
{ = − xe − e −x+θ =
⎪ u dv u du
⎪ v v
int egración ⎪ ⎛1 + x ⎞
⎨ = − (1 + x) e − x + θ = − e − θ ⎜⎜ ⎟⎟
por partes ⎪ ⎝ ex ⎠
⎪ ∞
⎪ ∞ x e − x + θ dx = − e − θ ⎛⎜ 1 + x ⎞⎟ = 1 + θ
⎪ ∫θ ⎜ x ⎟
⎩ ⎝ e ⎠θ
Solución.-
n ⎡ n ⎤
−θ ∑ xi ⎢ −θ ∑ xi ⎥
L (θ) = θ 2 n (x 1 L x n) e i = 1 ⇒ ln L (θ) = ln ⎢⎢θ 2 n (x 1 L x n) e i = 1 ⎥
⎥
⎢ ⎥
⎣⎢ ⎥⎦
n n n n
ln L (θ) = (2 n) ln θ + ln ∏ x i − θ ∑ x i ⇒ ln L (θ) = (2 n) ln θ + ∑ ln x i − θ ∑ x i
i=1 i=1 i=1 i=1
ϑ ln L (θ) 2n n 2n
= − ∑ xi = 0 ⇒ θ̂ =
ϑθ θ i=1 n
∑ xi
i=1
27.- El coseno X del ángulo con el que se emiten los electrones en un proceso
radioactivo es una variable aleatoria con función de densidad
⎧( 1 + θ x ) 2 −1 ≤ x≤ 1
f θ (x) = ⎨ − 1 ≤ θ≤ 1
⎩ 0 en el resto
Solución.-
a) Se plantea la ecuación E [ X] = x
1
1+ θx ⎡x 2 θx3⎤ θ
x = E [X] =
1
ˆ
∫ −1
x
2
dx = ⎢
⎢⎣ 2
+
6
⎥
⎥⎦ −1
=
3
⇒ θ = 3x
V (X) 9
b) V (ˆθ) = V (3 x) = 9 V (x) = 9 = V (X)
n n
2 1 2
1+ θx ⎡θ⎤ ⎡x 3 θx 4⎤ ⎡θ⎤ 3 − θ2
V (X) = E (X ) − [E (X)]
2 2 1 2
= ∫ −1
x
2
dx − ⎢ ⎥
⎣3⎦
= ⎢ + ⎥ − ⎢ ⎥ =
⎣⎢ 6 8 ⎥⎦
−1
⎣3⎦ 9
9 9 ⎡3 − θ 2 ⎤ 3 − θ 2
de donde, V (ˆθ) = V (X) = ⎢ ⎥=
n n ⎣⎢ 9 ⎦⎥ n
⎧ lim E (ˆ
θ) = θ
⎪n→ ∞
Para probar que θ̂ es consistente para estimar θ es suficiente probar ⎨
⎪ lim V (ˆ
θ) = 0
⎩n → ∞
θ
lim E (ˆ
θ) = lim E (3 x) = lim 3 E (x) = 3 E (X) = 3 =θ
n→ ∞ n→ ∞ n→ ∞ 3
3 − θ2
lim V (ˆ
θ) = lim V (3 x) = lim =0
n→ ∞ n→ ∞ n→ ∞ n