Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Inferencia Estadstica:
Estimacin
Objetivo: Cmo podemos utilizar la muestra para
estimar valores de los parmetros poblacionales?
Estimacin puntual: Una nica estadstica que
es la mejor supocisin para el valor del parmetro
Estimacin por intervalos: Un intervalo de
nmeros alrededor de la estimacin puntual, que
tiene unnivel de confianza fijo de contener el
valor del parmetro, llamado intevalo de
confianza.
(Basado en las distribuciones muestrales del estimador
puntual)
Estimadores puntuales
Estimadores puntuales uso ms comn de
valores muestrales
Media muestral estima la media poblacional
y
2
(
y
y
)
i
Proporcin muestral
poblacional
n 1
estima la proporcin
Intervalos de confianza
Un intervalo de confianza (IC) es un intervalo de
nmeros que se cree contienen el valor del
parmetro.
La probabilidad que el mtodo produzca un intervalo
que contenga el parmetro se llama nivel de
confianza. Es comn usar nmeros cercanos a 1,
tales como 0.95 0.99.
La mayora de los ICs tiene la forma
estimacin puntual
margen de error
/ n (1 ) / n
Encontrar un IC en la
prctica
Complicacin: El verdadero error estndar
/ n (1 ) / n
1
(1 )
by se
n
n
Ejemplo
Qu porcentaje de Americanos de 18-22 aos
reportan ser very happy?
Datos 2006 GSS: 35 de n = 164 dicen ser very
happy
(otros
ser(.31
pretty
35reportan
/164 .213
for allhappy
ages), o not too
happy)
se (1 ) / n 0.213(0.787) /164 0.032
95% CI is 0.213 1.96(0.032), or 0.213 0.063,
(p.ej., margen de error = 0.063)
lo que resulta en (0.15, 0.28).
Tenemos una confianza del 95% que la proporcin
Ejercicio
Encuentra un IC del 99% con estos datos
0.99 probabilidad central, 0.01 en dos colas
0.005 en cada cola
Valor-z es 2.58
IC del 99% es 0.213 2.58(0.032),
0.213 0.083, lo que resulta en (0.13, 0.30)
Mayor confianza requiere IC ms anchos
Recuerda que un IC del 95% era (0.15, 0.28)
Ejemplo
Asume que la proporcin muestal de 0.213 est basada
en n = 656 (en lugar de 164)
/2
z
=
1
coeficiente
de
confianza
90%
.10
.050
1.645
/2
95%
99%
.05
.01
.025
.005
1.96
2.58
z ( se) with se (1 ) / n
El valor-z es tal que, asumiendo una distribucin normal, la
probabilidad de estar a z errores estndar de la media es igual
al nivel de confianza
(p.ej., z = 1.96 para una confianza del 95%,
z = 2.58 para una confianza del 99%)
Con n para la mayora de encuestas de opinin (aprox. 1000), el
margen de error usualmente alrededor de 0.03 (idealmente)
El mtodo requiere una n grande para que la distribucin
muestral de la proporcin muestral sea aprox. normal (TCL) y
que la estimacin del verdadero error estndar verdadero sea
decente
En la prctica, ok si se tiene al menos 15 observaciones en cada
categora
Ejemplo: n=164, 35 very happy, 164-35 = 129 no very
happy
= 0/20 = 0.0,
| | 1.96 (1 ) / n
Ejemplo: Para n = 20 resolver la ecuacin cuadrtica
para , las soluciones son 0 y 0.16, as que un IC del 95%
es (0, 0.16)
Agresti and Coull (1998) sugiriero utilizar la forma usual
de calculara un IC
estimacin z(se)
despus de aadir 2 observaciones de cada tipo. Este
mtodo ms simple funciona bien incluso para n muy
pequeas (95% IC tiene el mismo punto medio que el IC
de Wilson)
Ejemplo: 0 vegetarianos, 20 no-veg
cambia a
IC del 95% CI es
Un problema
Se desconoce el error estndar (s tambin es
un parmetro). Se estima reemplazando s con
s
se
s
y 1.96( se), which is y 1.96
n
Esto funciona ok para n grande, porque
entonces s es una buena estimacin de (y
aplica el TCL). Pero para n pequea,
reemplazar por su estimacin s introduce un
error extra, y el IC no es lo suficientemente
ancho a menos que se reemplace el valor-z por
otro ligeramente ms grande el valor-t
La distribucin t (t de
Student)
Forma de campana, simtrica alrededor de 0
Desviacin estndar un poco ms grande que 1
(colas ligeramente ms anchas que la distribucin
normal estndar, que tiene media = 0 y desv.
estndar = 1)
La forma precisa depende de los grados de
libertad (df). Para inferencia sobre la media,
df = n 1
Se vuelve ms angosta y se parece ms a la
distribucin normal estndar a medida que los df
aumentan
(casi idnticas cuando df > 30)
IC para la media tiene un margen de error t(se),
(en lugar de z(se) como el IC para la proporcin)
Parte de la tabla t
Nivel de confianza
90%
df
t.050
1
6.314
10
1.812
30
1.697
100
1.660
infinity
1.645
95%
t.025
12.706
2.228
2.042
1.984
1.960
98%
99%
t.010
31.821
2.764
2.457
2.364
2.326
t.005
63.657
3.169
2.750
2.626
2.576
se s / n 7.157 / 17 1.736
Ya que n = 17, df = 16, valor-t para un IC del 95% es 2.12
Un IC del 95% para la cambio en peso promedio (pob.) es
Ejemplo: Ver TV en EU
Ejemplo: GSS pregunta On average day, how
many hours do you personally watch TV?
y= 2.865, s = 2.617
n = 899,
Cul es un IC del 95% CI para la media
poblacional?
df = n-1 = 898 son muchos, as que el valor-t
(1.9626) es prcticamente igual a z = 1.96
Demuestra que se = 0.0873,
IC del 95% es 2.865 0.171, (2.69, 3.04)
Interpretacin?
Opcin mltiple
a. Tenemos una confianza del 95% que la
media muestral est entre 2.69 y 3.04
horas.
b. 95% de la poblacin ve tele entre 2.69 y
3.04 horas al da
c. Tenemos una confianza del 95% que la
media poblacional est entre 2.69 y 3.04
d. Si se repiten muestras
de tamao 899, a la
y
larga 95% de ellas contendran
= 2.865
Nota: El mtodo t para IC asume una
distribucin poblacional normal. Crees que
t de Student
Debido a que las reglas de la compaa
prohiban la publicacin de trabajo de la
empresa con el nombre de uno, Gosset
us el pseudnimo Student en los
artculos que escribi sobre sus
(a
veces
llamada
descubrimientos
A l le dieron slo muestras
distribucin
t
de
Student
pequeas de cerveza para
probar (por qu?), y de di
cuenta que no poda utilizar los
valores-z de la normal despus
de sustituir s en la frmula del
Escoger el tamao de
muestra
Ejemplo: Qu tan grande debe ser una
muestra para estimar la proporcin
poblacional (p.ej., very happy)
0.03, con una probabilidad de 0.95?
Es decir, Qu n resulta en un margen de
error de 0.03 en un intervalo de
confianza del 95%?
Igualamos 0.03 = margen de error y
0.03 1.96
n 1.96 (1 ) / n
despejamos
para
Solucin
n (1 )(1.96 / 0.03) 2 4268 (1 )
El valor ms grande de n ocurre para = 0.50,
as que somos conservadores al seleccionar
n = 4268(0.50)(0.50) = 1067
Si slo se necesita un margen de error de 0.06,
se requiere
Seleccionar el tamao de
muestra
Determinar el parmetro de inters (media
poblacional o proporcin poblacional)
Seleccionar un margen de error (M) y un
nivel de confianza (determina el valor-z)
Proporcin (siendo conservadores, p =
0.50)
z
n (1 )
M
n 2
47
= 1, 2
so = 1
2
yP( y )
( y ) P( y ) 1
2
Posibles muestras
2
(igualmente probables) ( yi y )
(0, 0)
n0
(0, 2)
1
(2, 0)
1
(2, 2)
0
Media de estimaciones
0.5
( yi y ) 2
n 1 0
2
2
0
1.0
( yi ) 2
n1
1
1
1
1.0
(imagen)
Bootstrap es un mtodo moderno (Brad Efron) para
generar IC sin utilizar mtodos matemticos para
derivar una distribucin muestral que asuma una
distribucin de la poblacin en particular. Se basa en
tomar muestras repetidas de tamao n (con reemplazo)
de la distribucin de los datos de la muestra.
Utilizar IC en la prctica (o
tareas)
Cul es la variable de inters?
cuantitativa inferencia sobre la media
categrica inferencia sobre la proporcin