Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2.1 Introducción. 1
Conclusión 15
Bibliografía 16
2. Estimación.
2.1. Introducción.
A la inferencia estadística le interesa sacar conclusiones de una gran población,
fundándose en las observaciones de una parte de la muestra.
La estadística nos proporciona herramientas que formalizan y uniforman los
procedimientos para sacar conclusiones siempre que las muestras seleccionadas
sean representativas de la población que han sido extraídas. Esta
representatividad permite extender los valores que describen a las muestras, tales
como la media, la desviación típica, un coeficiente de correlación, a la población
correspondiente, es decir, la media o la desviación típica pueden tomarse como
estimadores de los parámetros μ y σ, valores que caracterizan a la población.
pág. 1
2.2. características de un estimador
1) Sesgo. Se dice que un estimador es insesgado si la Media de la distribución del
estimador es igual al parámetro.
Estimadores insesgados son la Media muestral (estimador de la Media de la
población) y la Varianza (estimador de la Varianza de la población):
Ejemplo
En una población de 500 puntuaciones cuya Media (m) es igual a 5.09 han hecho
un muestreo aleatorio (número de muestras= 10000, tamaño de las muestras=
100) y hallan que la Media de las Medias muestrales es igual a 5.09, (la media
poblacional y la media de las medias muestrales coinciden). En cambio, la
Mediana de la población es igual a 5 y la Media de las Medianas es igual
a 5.1 esto es, hay diferencia ya que la Mediana es un estimador sesgado.
2) Consistencia. Un estimador es consistente si aproxima el valor del parámetro
cuanto mayor es n (tamaño de la muestra).
Algunos estimadores consistentes son:
Ejemplo
En una población de 500 puntuaciones cuya Media (m) es igual a 4.9 han hecho
tres muestreos aleatorios (número de muestras= 100) con los siguientes
resultados:
vemos que el muestreo en que n=100 la Media de las Medias muestrales toma el
mismo valor que la Media de la población.
3) Eficiencia. Diremos que un estimador es más eficiente que otro si la Varianza
de la distribución muestral del estimador es menor a la del otro estimador. Cuanto
pág. 2
menor es la eficiencia, menor es la confianza de que el estadístico obtenido en la
muestra aproxime al parámetro poblacional.
Ejemplo
La Varianza de la distribución muestral de la Media en un muestreo aleatorio
(número de muestras: 1000, n=25) ha resultado igual a 0.4. La Varianza de la
distribución de Medianas ha resultado, en el mismo muestreo, igual a 1.12, (este
resultado muestra que la Media es un estimador más eficiente que la Mediana).
Cuasi-varianza muestral:
S 2 n−1=(x 1−¯ x ) 2+ ⋯+(xn−¯ x)2 n−1 , Sn−12=( x 1−x ¯ )2+ ⋯+(xn−x ¯ ) 2 n−1 ,
pág. 3
El demostrar que un cierto estimador cumple estas propiedades puedes ser
complicado en determinadas ocasiones. Existen varios métodos que nos van a
permitir obtener los estimadores puntuales. Los más importantes son:
Ejemplo
Se generan 100000 muestras aleatorias (n=25) de una población que sigue la
distribución Normal, y resulta:
pág. 4
La distribución de las Medias muestrales aproxima al modelo Normal:
pág. 5
Varianza conocida
Varianza desconocida
Varianza conocida
Varianza desconocida
Se distribuye según una t-student de n-1 grados de libertad. Por tanto, el intervalo
de confianza resultante es:
Donde tα /2 es el valor de una distribución t-Student con n-1 grados de libertad que
deja a su derecha una probabilidad de α /2.
pág. 6
Para construir intervalos de confianza para la diferencia de medias poblacionales
se hace uso de la distribución en el muestreo de la diferencia de medias
muestrales.
Se sabe que si X 1 n ( μ , σ ) ∀ i=1,2 , ….. n son variables aleatorias independientes,
entonces:
σ
X̄ N ( μ , )
√n
Y, por lo tanto, si las distribuciones de las variables Xi son normales, cualesquiera
σ
sean los tamaños muestrales, se verificará que X̄ N ( μ , ),i=1,2.
√n
También se sabe que para muestras independientes se puede asegurar que la
distribución de la diferencia de medias muestrales es
σ 12 σ 22 si las distribuciones de las variables de X1 son
̄
X̄ 1− X 2 N (μ 1−μ 2
normales.
√ +
n1 n2
)
pág. 7
2.4.4. Intervalos de confianza para diferencias de proporciones.
Si dos muestras independientes de tamaño nx y ny se extraen de poblaciones
infinitas con distribuciones binomiales, X representa el numero de observaciones
de la primera muestra que corresponde a la clase en cuestión, entonces la
distribución de muestreo para la diferencia de proporciones esta dada por
Donde Z N (0,1)
De la definición se obtiene el intervalo de confianza de dos lados para la diferencia
de proporciones, con un nivel de confianza de ( 1−∝ ) 100 % , el cual es
pág. 8
μ D=E ( D ) =μ 1−μ2
nS2 nS2
1-09/2 oc/2
Ejemplo
Solución. Se utiliza la expresión 2.6. Los valores de Z„oy Zl-«n pertenecen a una
distribución chi-cuadrado con 29 grados de libertad. cómo puede observarse en la
figura I el área que hay por debajo de X$2, es 0,05, el valor es: 17,71 y el área
que hay por debajo de X 1_oc/2 2 es 0,95, por lo tanto, el valor de la Ji cuadrado
es de 42,56
pág. 9
17.71 42,56
30(32.000) 30(32.000)
42? 56 17,71
pág. 10
Entonces un intervalo de confianza al nivel para la varianza de una
distribución gaussiana (cuyos pares metros desconocemos) lo obtenemos
pág. 11
Gutiérrez y de la Vara [13]). Marrugat et al. [42] sostiene que la estimación del
tamaño muestral puede considerarse un instrumento del que dispone el
investigador para evaluar la factibilidad y la necesidad de recursos de su proyecto.
Sin embargo, la utilización de hipótesis verosímiles deberá prevalecer sobre otros
intereses como las posibilidades económicas, la disponibilidad de recursos u otros.
No es ético realizar un estudio con un tamaño de muestra que no ofrezca un poder
estadístico suficiente, ya que, desde el punto de vista de la metodología científica,
el diseño no es adecuado. Kerlinger y Lee [37] y Camacho-Sandoval [38], afirman
que para aquellos investigadores que llevan a cabo grandes investigaciones
donde el costo de la recolección de datos es alto, la determinación del tamaño de
muestra resulta crítica, ya que el interés radica en conseguir la mejor información
al menor costo:
Un tamaño de muestra demasiado grande representa un desperdicio de
recursos, tanto materiales como humanos (Fuentelsaz [40]). Además, la
calidad del estudio, dado dicho incremento, puede verse afectada en
sentido negativo (Fernández [39]).
Un tamaño demasiado pequeño es un desperdicio de esfuerzo, pues no
podrá detectar un efecto significativo o se tendrán menos probabilidades de
hacerlo.
Kerlinger y Lee [37] manifiestan que aunque la mayoría de los investigadores
tratan de simplificar los conceptos y procedimientos implicados, el proceso de
determinación del tamaño muestral para estudios de investigación no resulta
trivial ni sencillo. De hecho, afirman que es uno de los problemas más difíciles
en la estadística aplicada.
Namakforoosh [34], Kerlinger y Lee [37] y otros autores, mencionan el uso de
métodos con reglas intuitivas sin justificación alguna. Uno de ellos es calcular
el tamaño muestral con base en una proporción del tamaño de la población
(2%), otra es asignar arbitrariamente un valor grande (2000). Ninguna de estas
opiniones es válida.
pág. 12
que se van a estudiar. 95% es el nivel de confianza más común, pero si se desea
un nivel de confianza mayor se usa 99%, y si se desea un nivel menor se usa
90%. En cuanto al error de muestreo, no debe pensarse en qué cantidad de error
se desea (en realidad no se quiere tener errores) sino cuánto se puede tolerar
para poder proporcionar conclusiones adecuadas al estudio. También se debe
disponer de una estimación de la desviación poblacional, que en algunos casos se
la realiza a partir de datos históricos o experiencia del experto, o también se puede
llevar a cabo un estudio piloto para estimarla con los datos muestrales.
Despejando de n0 (2), el mínimo tamaño de muestra para no exceder el error
máximo, tomando en cuenta una población infinita viene dado por la expresión:
N −n
donde la expresión se conoce como el multiplicador de población finita, que
N−1
es un factor de ajuste, y se utiliza para rebajar la varianza muestral estimada
(Namakforoosh [34]). Despejando n de la ecuación (4):
pág. 14
Conclusión.
Después de leer y analizar esta unidad llegue a la breve conclusión que el objetivo
principal de la estadística inferencial es la estimación, esto es que mediante el
estudio de una muestra de una población se quiere generalizar las conclusiones al
total de la misma. Como vimos en el desarrollo de temas anterior, los estadísticos
varían mucho dentro de sus distribuciones muestrales, y mientras menor sea el
error estándar de un estadístico, más cercanos serán unos de otros sus valores.
Existen dos tipos de estimaciones para parámetros; puntuales y por intervalo. Una
estimación puntual es un único valor estadístico y se usa para estimar un
parámetro. El estadístico usado se denomina estimador. Una estimación por
intervalo es un rango, generalmente de ancho finito, que se espera que contenga
el parámetro.
pág. 15
Bibliografías.
https://explorable.com/es/distribucion-de-muestreo
https://bookdown.org/aquintela/EBE/estimacion-puntual.html
https://www.uv.es/webgid/Inferencial/5_estimacin_por_intervalos.html
http://www5.uva.es/estadmed/inferen/estima_inter/intervalos3.htm
https://www.uv.es/webgid/Inferencial/42_caractersticas_estimadores.html
file:///C:/Users/jesus/Downloads/0311%20(4).pdf
pág. 16