Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 1 Esp
Tema 1 Esp
Inferencia estadstica
Estimadores puntuales
I
Estimaci
on de la media y la varianza de una poblaci
on
Estimaci
on de la media de la poblaci
on mediante intervalos de
confianza
I
Estimaci
on de la varianza de la poblaci
on mediante intervalos de
confianza
I
Calcular un tama
no muestral necesario para controlar la longitud de
un intervalo de confianza
Referencias
I
Captulos 7 y 8 (8.1-8.6)
Ross, S. Introducci
on a la Estadstica
I
Captulo 8
Poblaci
on: el conjunto de toda la informaci
on numerica relativa a
una cantidad de interes.
I
Estimaci
on: una realizaci
on concreta del estimador, por ejemplo T ,
correspondiente a una muestra observada, x1 , x2 , . . . , xn , y que
proporciona una aproximaci
on al valor del parametro de interes.
Queremos conocer
X = E[X ]
X F
Tenemos n copias
de X
X = E[X ]
Valor esperado de X
X1 , X2 , . . . , Xn F
Muestra
Tenemos n
valores observados de
X1 , X2 , . . . , Xn
X
Media muestral
x1 , x2 , . . . , xn
Muestra observada
Estimaci
on de X (un n
umero)
x
Media muestral
Var. pobl.
...
En general, X
media muestral
prop. muestral
T (X n )
X1 +...+Xn
n
2
2
i Xi n(X )
nP
)2
Xi2 n(X
muestral i n1
P
var. muestral
quasi var.
...
...
n
X2
n1
Estimador:
notaci
on
=
X
X
p
X
Estimaci
on:
notaci
on
x
p
x
X2
x2
sX2
sx2
...
x
...
X
Estimador
T (X n )
X
p
X
X2
sX2
X
Sesgo
] X = 0
E[X
E[
pX ] pX = 0
E[
X2 ] X2 6= 0
E[sX2 ] X2 = 0
E[X ] X
Insesgado?
S
S
No
S
A menudo
Estimador insesgado
de mnima varianza?
S, si X normal
S
No
S, si X normal
Rara vez
I
I
El error cuadr
atico medio de un estimador insesgado es igual a su
varianza.
Un estimador con menor ECM es mejor.
El estimador insesgado de mnima varianza tiene la menor
varianza/ECM entre todos los estimadores.
Estimaci
on m
aximo verosmil
M
etodo de momentos
16
10
12
sx2
px
=
=
80
=8
10
782 10(8)2
= 15,78
10 1
1+1+0+1+1+0+0+0+0+0
10
0,4
X tambi
en es insesgado:
"
E[
X ]
Y su varianza/ECM es:
"
E
n(n + 1)
V[
X ]
2
=
n(n + 1)
=indep.
#
2
(X1 + 2X2 + . . . + nXn )
n(n + 1)
!2
2
2
2
(V[X1 ] + 2 V[X2 ] + . . . + n V[Xn ])
n(n + 1)
2
=id
n(n + 1)
2X
n(n + 1)
(X + 2X + . . . + nX )
4
=id
n(n+1)/2
z
}|
{
(1 + 2 + . . . + n) = X
n2 (n + 1)2
2(2n + 1)
=
3n(n + 1)
2
X
Sesgo[
X ] = 0
ECM[
X ]
,
Eficiencia relativa(X
X ) =
X2 /n
2(2n+1) 2
3n(n+1) X
V[
X ] + 0
n(n+1)(2n+1)/6
}|
{
z
2
2
2
2
X (1 + 2 + . . . + n )
2(2n + 1)
=
3n(n + 1)
2
X
3(n + 1)
2(2n + 1)
es un
Puede verse que para n 2 este cociente es menor que 1, y por tanto X
estimador m
as eficiente para X .
I
I
El tama
no muestral - una muestra mayor debiera proporcionar una
informaci
on m
as precisa sobre el par
ametro de la poblaci
on.
Variabilidad en la poblaci
on - una muestra de una poblaci
on con
menos varianza debiera proporcionar estimaciones m
as precisas
Que se conozcan otros par
ametros de la poblaci
on.
etc
100(1 ) %
0.01
99 %
0.05
95 %
0.10
90 %
z12 = z2
z2
Z
z/2 z }| {
X
z }| { X
< z/2 ) = 1
4. Se tiene que P(z1/2 <
X / n
z/2 X
n
X
z/2 + X
n
<
X
X
X / n
<
X <
<X
< X <
> X >
z/2
X
z/2
n
X
+ z/2
X
n
X
z/2
X
n
X
X
X
IC1 (X ) = x z/2 , x z/2
= x z/2
n
n
n
X
Poblaci
on:
Objetivo: IC0,95 (X ) = x z/2
n
X = peso de una bolsa (en g)
2
2
X N(X , X = 12 )
X = 12
'
MAS: n = 25
Muestra: x = 198
Area=
0.025
z0.025 = 1.96
n = 25
x = 198
1 = 0,95
/2 = 0,025
z/2
IC0,95 (X )
=
=
z0,025 = 1,96
12
198 1,96
25
(198 4,7)
(193,3, 202,7)
Interpretaci
on: Podemos tener una
confianza del 95 % de que X
est
a en (193,3, 202,7)
(1 ) = 0,9, n = 50
(1 ) = 0,99, n = 50
150
X est
a en aprox. 150(0,99) = 148,5 interv.
(pero no en 150(0,01) = 1,5)
150
X est
a en aprox. 150(0,9) = 135 interv.
(pero no en 150(0,1) = 15)
|
|
| | |
| |
|| |
| |
|
|
| |
| |
|
|
|
|
||
|
|
|
|
| | |
|
| |
|
|
||
|
||
|
|
|
| |
| |
|
| ||
||
|
| ||
|
|
|
|
|
| |
|
|
|
|
|
| |
|
| |
|
|
|
|
||
|
||
|
| |
|
|
|
| |
|
|
| |
|
|| |
|
|
|
|
|
||
|
|
| ||
|
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
||
|
|
|
|
|
|
|
| | |
|
|
|
|
| |
|
6.0
5.5
5.0
Indice
100
50
100
Indice
0
50
|
|
| | |
| |
|| |
| |
|
|
| |
| |
|
|
|
|
||
|
|
|
|
| | |
|
| |
|
|
||
|
||
|
|
|
| |
| |
|
| ||
||
|
| ||
|
|
|
|
|
| |
|
|
|
|
|
| |
|
| |
|
|
|
|
||
|
||
|
| |
|
|
|
| |
|
|
| |
|
|| |
|
|
|
|
|
||
|
|
| ||
|
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
||
|
|
|
|
|
|
|
| | |
|
|
|
|
| |
|
4.5
4.0
6.0
Intervalo de confianza
5.5
5.0
4.5
4.0
Intervalo de confianza
z/2
z/2 X
=2
z/2 X
, aumenta
(1 ) = 0,9, n = 50
(1 ) = 0,9, n = 200
150
150
|
|
| | |
| |
|| |
| |
|
|
| |
| |
|
|
|
|
|
|
|
|
|
|
| | |
|
| |
|
|
||
|
||
|
|
|
| |
| |
|
| ||
||
|
| ||
|
|
|
|
|
| |
|
|
|
|
|
| |
|
| |
|
|
|
|
||
|
||
|
| |
|
|
|
| |
|
|
| |
|
|| |
|
|
|
|
|
||
|
|
| ||
|
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
||
|
|
|
|
|
|
|
| | |
|
|
|
|
| |
|
|| |
|
|
|
|
|
|
|| |
| |
|
|| |
| | |
|
|| |
||
| |
||
|| |
|
|
|
|
|
| | |
|
| |
||
| | |
| ||
||
|
|| |
|
| |
| ||
|
|
| |
|
|
|
| ||
|
||
|| |
|| |
||
|||
||
| |
|
|
|
|
||
|
|
||
|
| |
| | |
| | |
||
|
|
| | |
| | |
| |
|
|||
|
|| |
|
| ||
|
|
|| |
|
||
| ||
| |
|
6.0
5.5
5.0
Indice
50
0
100
Indice
0
50
100
4.5
Intervalo de confianza
4.0
6.0
5.5
5.0
4.5
Intervalo de confianza
4.0
'
MAS: n =?
longitud
z }| {
z/2
IC0,99 (X ): 2
2(0,5) = 1
n
Area=
0.005
z0.005 = 2.575
2z/2
2
22 z/2
2
85,93
X / n
z12 = z2
z2
Z
z/2 z }| {
X
z }| { X
< z/2 ) = 1
4. Imponemos la condici
on P(z1/2 <
X / n
X
X
< z/2
X / n
(X z/2 , X + z/2 )
n
n
6. El intervalo de confianza es:
x
IC1 (X ) = (
x z/2 , x + z/2 )
n
n
X / n
v
alido si la desviaci
on tpica de la
poblaci
on se estima (no se conoce)
p
X pX
p
approx. N(0, 1)
p
(1 p
)/ n
|
{z
}
X / n
Poblaci
on:
X = 1 si un ejecutivo permite tomar
decisiones a su personal y 0 en otro caso
X Bernoulli(pX )
'
Muestra: p
x =
83
344
p
x = 0,241
p
x z/2
z0.05 = 1.645
n = 344
1 = 0,9
/2 = 0,05
z/2
z0,05 = 1,645
0
IC0,9 (pX )
@0,241 1,645
= 0,241
Area=
0.05
p
x (1
px )
n
(0,241 0,038)
(0,203, 0,279)
0,241(1 0,241)
344
Interpretaci
on: Podemos tener una confianza
del 90 % de que la proporci
on de ejecutivos
que permiten tomar sus propias decisiones a
sus empleados, pX , est
a en (0,203, 0,279)
1
A
P(tn1;1/2
tn1
z}|{
< T < tn1;/2 ) = 1
Densidad t de Student
tn1 ; 12 = tn1 ; 2
tn1 ; 2
n
n2
4. Imponemos la condici
on
T tn1
z }| {
tn1;/2
X
z }| {
X
< tn1;/2 ) = 1
P(tn1;1/2 <
sX / n
<
X
X
sX / n
<
tn1;/2
(X tn1;/2 , X + tn1;/2 )
n
n
6. El intervalo de confianza es:
sx
sx
IC1 () = (
x tn1;/2 , x tn1;/2 )
n
n
Poblaci
on: X = mpg de un coche
Objetivo: IC0,9 (X ) = x tn1;/2 sxn
de este modeloX N(X , X2 )
p
X2 desconocida
sx =
0,96 = 0,98
'
n=6
MAS: n = 6 peque
na
Muestra: x =
sx2
116,9
6
= 19,4833
2282,41 6(19,4833)2
=
= 0,96
61
Area=
0.05
t5 ; 0.05 = 2.015
x = 19,48
1 = 0,9
/2 = 0,05
tn1;/2
IC0,9 (X )
=
=
t5;0,05 = 2,015
0,98
19,48 2,105
6
(19,48 0,81)
(18,67, 20,29)
Interpretaci
on: Tenemos una
confianza del 90 % de que el
consumo promedio de este modelo,
X , estar
a entre 18.67 y 20.29 mpg
Media muestral
Semilongitud IC
Datos
Sabemos que T tn si T = Z2
Tambien, 2n es la distribuci
on de la suma de los cuadrados de n variables
aleatorias N(0, 1) independientes.
n
2
X
2
(n 1)sX2
Xi X
i=1 (Xi X )
=
=
2n1
X2
X2
X
i=1
n /n
distribuci
on chi-cuadrado con gl = n, y ambas son independientes.
Por que n 1 y no n?
Si conociesemos el valor de X , el
n
umero de grados de libertad sera
n, porque tendramos n variables
X
aleatorias iid Xi
X
Xi X
(si se conocen los valores de
X
n 1 de ellas, se puede deducir
f
acilmente el valor de la restante)
0.15
Densidades de 2
0.0
0.00
0.1
0.05
0.2
N(0,1)
gl=10
gl=5
gl=3
gl=20
gl=15
gl=10
gl=5
0.10
0.3
0.4
Densidades de t y N(0, 1)
10
20
30
40
Densidad chi-cuadrado
4. Imponemos la condici
on P(2n1;1/2
2n1 ; 1
2
2n1 ;
2
2n1
z }| {
(n 1)sX2
<
< 2n1;/2 ) = 1
2
<
(n1)sX2
X2
<
2n1;/2
>
X2
(n1)sX2
>
1
2n1;/2
> X2 >
(n 1)sX2
2n1;/2
(n 1)sx2 (n 1)sx2
,
2n1;/2 2n1;1/2
Poblaci
on:
X = concentraci
on del
ingrediente activo en una pastilla
(in %)X N(X , X2 )
'
MAS: n = 15
Muestra: sx = 0,8
Area=
0.05
Area=
0.05
=23.68
2) = @
Objetivo: IC0,9 (X
1
(n1)sx2
(n1)sx2
A
, 2
2
n1;/2
n1;1/2
n = 15
1 = 0,9
/2 = 0,05
2n1;1/2
214;0,95 = 6,57
2n1;/2
IC0,9 (X2 )
214;0,05 = 23,68
14(0,64) 14(0,64)
,
23,68
6,57
(0,378, 1,364)
p
p
( 0,378, 1,364)
(0,61, 1,17)
=
IC0,9 (X )
a los
Par
ametro
Media
Hip
otesis
Datos normales
Varianza conocida
X
X N(0, 1)
X / n
Datos no normales
Muestra grande
X
X
approx. N(0, 1)
X / n
Datos Bernoulli
Muestra grande
Datos normales
Varianza desconocida
Varianza
Datos normales
Desv. tpica
Datos normales
(1 ) Intervalo Conf.
Cantidad pivotal
p
X pX
approx. N(0, 1)
p
X (1
pX )/n
X
X tn1
sX / n
2
(n1)sX
2
n1
2
X
2
(n1)sX
2
n1
2
X
x z/2 X , x + z/2 X
n
n
X x z/2 x , x + z/2 x
n
n
#
r
p
x (1
px )
pX p
x z/2
n
s
s
x tn1,/2 x , x + tn1,/2 x
n
n
0
1
(n1)sx2
(n1)sx2
2
A
X @ 2
, 2
n1;/2
n1;1/2
0v
1
v
u
u
(n1)sx2
u (n1)sx2
u
A
X @t 2
,t 2
n1;/2
n1;1/2
X distribuci
on con media X y desviaci
on tpica X
.
.
conocida
&
basada en z
(exacta)
basada en t
(exacta)
X normal
desconocida
&
.
n peque
na
&
metodos mas
alla de Est II
basada en z
(aprox. TCL)
X normal
n grande