Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Año 2017
Introducción
La Inferencia estadística
Estimador y estimación
Un estimador es un estadístico.
3
Para que una muestra sirva adecuadamente como base para obtener
estimadores de parámetros poblacionales, debe ser representativa de la
población. No solo se debe pensar en el tamaño de la muestra sino
asegurarse estadísticamente su calidad. Es decir, que esa muestra
represente verdaderamente a la población hacia la cual se extienden los
resultados. Sabemos que un método de muestreo aleatorio asegura que la
muestra elegida sea representativa de la población y que el proceso sea
adecuado. Que sea representativa, significa que la información
proporcionada por una muestra será en mayor o menor grado, un reflejo de
la información contenida en la población. Por lo tanto podemos servirnos de
las muestras para hacer inferencias sobre la población.
Todo valor estadístico tiene una distribución muestral (la media, la mediana,
la desviación estándar, la diferencias entre medias de una misma población,
una proporción, la correlación, etc.).
Datos: 1; 2; 3
µ=6/3=2
σ2=2/3=0,66
σ= 0,66 =0,81
las muestras X
1-1; 1
1-2; 1,5
1-3; 2
2-1; 1,5
2-2; 2
2-3; 2,5
3-1; 2
3-2; 2,5
3-3 3
6
Esta tabla nos muestra las medias de las distintas muestras. Podemos ver
las veces que las mismas se repiten. Es decir construir un cuadro de
frecuencias.
_
_
X F P f.X
1 1 0.11 1
1,5 2 0.22 3
2 3 0.33 6
2,5 2 0.22 5
3 1 0.11 3
N 9 1.00 18
µ X =18/9=2= µ
_
σ2 X =3/9=0,33
_
σX =_
0,33 0,57
σ2/n= 0,66/2=0,33
σ= σ/ n =0,57
X
_
X X
_
/√n.
Esto es lo que dice lo que se suele llamar Teorema del límite central o
central del límite:
X
_
igual a σ =σ /√n ”.
_
X
_
X
8
X
_
Pero por más maravilloso que sea el Teorema del Límite Central presenta
como mínimo dos problemas:
X X
z= o bien, (valor X respecto a la media)
9
X
Lo mismo con el estadístico (media de las muestras)= (media
x
respecto a la parámetro)
–
= . Y definimos una nueva variable aleatoria t. Por ello, en las muestras
√
Comparemos:
Z= X µ / σ/ n
t= X µ / Sn/ n -1
S X =S/ n -1
_
Se trata de una familia de curvas porque hay una distribución t por cada
número diferente de grados de libertad. A medida que aumentan los grados
de libertad la distribución se asemeja cada vez más a la normal, tal como s
se
observa en el gráfico siguiente:
Estimación de parámetros
12
1) Estimación puntual
Es decir que
13
µ porque µ X =µ_
es menor que la del 2. Una mayor eficiencia, por lo tanto indica que un
estadístico varía menos de muestra en muestra por lo que las
estimaciones que se pueden hacer con él serán más precisas que las
efectuadas con un estimador menos eficiente.
estimaciones están muy por encima del verdadero valor, y otras muy por
debajo. Aunque se estén contrarrestando entre unas y otras para ofrecer
una estimación promedio correcta, podríamos estar cometiendo un error
muy grande al usar una de esas estimaciones. De ahí la importancia de que
un buen estimador debe ser además de insesgado, eficiente.
s
X z.
n
Podemos ser más exactos y definir los intervalos con un grado determinado
de confianza (95% y 99%). Un intervalo de confianza del 95 % es uno tal que
16
Entonces, una vez que ya hemos calculado el estadístico (la media, por
ejemplo) comenzamos el proceso de estimación del parámetro (esto es, la
media poblacional). Para ello nos basaremos en tres distribuciones: la de la
muestra , que es empírica; la de la población que es generalmente
desconocida e hipotética y la distribución muestral del estadístico que es
probabilística, y que es la que nos permite el pasaje de la muestra a la
población al permitirnos estimar el parámetro.
Pasos
Establecer el nivel de confianza (por lo general de 0,95 o de
0,99)
Calcular el error estándar estimado (porque no se conoce y se
usa s) de la distribución de muestreo de medias, que es igual a
s sobre raíz cuadrada de n. Calcular el error estándar de X _
donde eσ =s/√n
Nivel de Z
confianza
0,95 ±1,96
0,99 ±2,58
Veamos un ejemplo,
Así supongamos que para una muestra de 100 casos, la media sea de 20
puntos. Como no conocemos el σ de la población, en este caso lo que
tenemos es el desvío de la muestra, y hacemos el supuesto que es la mejor
estimación posible de la desviación estándar de la población. Usamos, para
estimar el error estándar de la distribución de muestreo de medias, la “s” de
la muestra que es =5. Entonces σX, que es 5/√100=5/10=0,5
X =20
n=100
s=5
σ =0,5
X
µ = X ±1,96.s/√n
µ= X ±1,96. 0, 5=
20±0,98
O sea que la µ se encuentra con un 95% entre los valores 19, 01 y 20,
98 con un 5% de error.
µ = X ±2,58.s/√n
µ= X ±2,58. 0, 5=
20±1,29
18,71 y 21,29
Veamos un ejemplo,
21
8
24±2,13.
16 1
24±4,41, o sea,
Tabla de puntajes t
Gl Probabilidad
0,10 0,05 0,02
0,01
…
…
25 2,06 2,79
…
….
Veamos un ejemplo:
( X X )
entonces queda: s2= , de modo que así tendremos una estimación
n 1
imparcial de la σ poblacional.