Agresti y Finlay - Cap 4 (85-99)

AGRESTI Y FINLAY - CAP 4 (85-99)
LAS DISTRIBUCIONES DE MUESTREO DESCRIBEN CÓMO VARÍAN LAS ESTADÍSTICAS

Las distribuciones de probabilidad resumen las probabilidades de posibles resultados para una variable.
Estas distribuciones, en la práctica, rara vez se conocen. Usamos datos muestrales para hacer inferencias
sobre los parámetros de esas distribuciones. Sin embargo, las distribuciones de probabilidad con los
valores de los parámetros fijados son útiles para muchos de esos métodos inferenciales.
Simular el proceso de estimación
Una simulación puede decirnos qué tan bien el resultado de una encuesta se aproxima al parámetro de la
población, por ejemplo, a la proporción de dicha población que vota por un candidato. Es posible realizar
esta simulación utilizando cualquier valor de proporción de población. Tomamos un valor de proporción,
asignamos números aleatorios a cada individuo/observación de la población y luego, mediante un
software, tomamos una muestra de tamaño n eligiendo al azar individuos de la población pidiendo al
software seleccione números aleatorios.
Representación de la variabilidad muestral mediante una distribución muestral
Si se seleccionan varias muestras aleatorias de un tamaño n cada una, una cierta cantidad predecible de
variación se produciría en los valores de las proporciones de la muestra. Una distribución de probabilidad
como la siguiente
describe la variación que ocurre de forma repetida seleccionando muestras de un cierto tamaño n y
formando un estimador particular. Esta distribución se llama distribución muestral. También
proporciona probabilidades de los posibles valores del estimador para una sola muestra de tamaño n.
Distribución muestral→ Una distribución muestral de un estimador es la distribución de probabilidad
que especifica las probabilidades de los posibles valores que puede tomar el estimador.
Cada estimador muestral tiene una distribución muestral. Hay una distribución muestral de una
media muestral, una distribución muestral de una proporción muestral, una distribución muestral de
una mediana muestral, y así sucesivamente. Una distribución muestral es simplemente un tipo de
distribución de probabilidad. A diferencia de las distribuciones estudiadas hasta ahora, una
distribución muestral especifica las probabilidades no para observaciones individuales sino para
posibles valores de un estimador calculado a partir de las observaciones. Una distribución muestral
permite calcular probabilidades sobre la proporción muestral→ una distribución muestral describe
las probabilidades de los posibles valores. La distribución muestral es importante en la estadística
inferencial porque nos ayuda a predecir qué tan cerca cae un estimador muestral del parámetro
poblacional que estima.
Interpretación de muestreo repetido de distribuciones muestrales:
Si diferentes encuestadoras realizarán cada una su propia encuesta obtendrán estimaciones diferentes,
porque las muestras tienen personas diferente.
Una distribución muestral de un estimador basada en n observaciones es la frecuencia relativa de
distribución para ese estimador resultante de tomar muestras de tamaño n repetidamente, calculando el
valor del estimador cada vez. Son las probabilidades sobre el valor del estimador muestral para una
muestra del tamaño dado n.
DISTRIBUCIONES DE MUESTREO DE MEDIOS DE MUESTRA

En la práctica, cuando analizamos datos y encontramos el promedio muestral ( y), no sabemos qué tan
cerca cae del promedio poblacional (μ), porque no conocemos el valor del promedio poblacional (μ).
Utilizando información sobre la extensión/probabilidad de la distribución muestral, sin embargo,
podemos predecir lo cerca que cae. Por ejemplo, la distribución muestral podría indicarnos que, con alta
probabilidad, y cae entre 10 unidades de μ
Error medio y estándar de la distribución muestral de y
La media muestral y es una variable, porque su valor varía de una muestra a otra. Para muestras
aleatorias, fluctúa alrededor de la media poblacional μ, a veces siendo más pequeños y, a veces, más
grandes. De hecho, la media de la distribución muestral de y es igual a μ. Si tomamos muestras
repetidamente, en el largo plazo, la media de la las medias muestrales serían iguales a la media
poblacional μ.
La extensión de la distribución muestral de y se describe por su desviación estándar, que se llama el error
estándar de y. La desviación estándar de la distribución muestral de y se denomina error estándar de y.
El error estándar de y se denota por y σ .
El error estándar describe cómo varía y de una muestra a otra. El símbolo y σ (en lugar de σ ) y la
terminología “error estándar” (en lugar de la desviación estándar) distingue esta medida de la desviación
estándar σ de la distribución de la población.
No es necesario tomar muestras repetidamente para encontrar el error estándar de y, porque hay una
fórmula disponible. El error estándar de y depende de n y de la desviación estándar poblacional σ :
σ
σ y=
√❑
Error medio y estándar de y → Considere una muestra aleatoria de tamaño n de una población que tiene
media μ y una desviación estándar σ . La distribución muestral de y da las probabilidades de los posibles
σ
valores de y. Tiene una media μ y un error estándar σ y =
√❑
Efecto del tamaño de la muestra sobre la distribución muestral y la precisión de las estimaciones
El error estándar se reduce a medida que aumenta el tamaño de la muestra n. La razón de esto es que el
σ
denominador (√ ❑) de la fórmula de error estándar σ y = aumenta a medida que n aumenta.
√❑
A medida que n aumenta, el error estándar disminuye y la distribución muestral se vuelve más estrecha.
Esto significa que la proporción muestral tiende a caer más cerca de la proporción de la población. Es más
probable que la proporción de la muestra se aproxime mucho a una proporción de población desconocida
cuando n = 2705 que cuando n = 100. Esto concuerda con nuestra intuición de que las muestras más
grandes proporcionan estimadores más precisos de las características de la población.
En resumen, hay un error que resulta de estimar μa partir de y, porque muestreamos solo una parte de la
población. Este error, el llamado error de muestreo, tiende a disminuir a medida que el tamaño de la
muestra n aumenta. El error estándar es fundamental para los procedimientos inferenciales que predicen
el error de muestreo al usar y para estimar μ.
La distribución muestral de la media muestral es aproximadamente normal
Teorema del límite central→ Para un muestreo aleatorio con un grande tamaño muestral n, la
distribución muestral de la media muestral y es aproximadamente una distribución normal.
Implicancias del teorema:
La normalidad aproximada de la distribución muestral aplica sin importar la forma que adquiera la
distribución de la población. Para muestras aleatorias grandes, la distribución muestral de y es
aproximadamente normal incluso si la distribución de la población está muy sesgada, tiene forma de U o
es muy discreta como la de una distribución binaria. Esto nos permite hacer inferencias incluso cuando la
distribución de la población es muy irregular. A medida que n crece, la distribución muestral tiene
una forma más acampanada (bell shape).
Qué tan grande debe ser n antes de que la distribución muestral tenga forma de campana en gran medida
depende de la asimetría de la distribución de la población. Si la distribución de la población tiene forma
de campana, en ese caso la distribución muestral tiene forma de campana para todos los tamaños n de
muestra.
Podríamos verificar empíricamente el teorema del límite central seleccionando repetidamente muestras
aleatorias, calculando y para cada muestra de n observaciones.
Saber que la distribución muestral de y es aproximadamente normal nos ayuda a encontrar las
probabilidades de los posibles valores de y. La distribución muestral de yproporciona la probabilidad de
que la media muestral se encuentre dentro de una cierta distancia de la media poblacional μ, incluso
cuando μ es desconocido.
REVISIÓN: POBLACIÓN, DATOS DE MUESTRA Y DISTRIBUCIONES DE MUESTREO

Distribución de la población: esta es la distribución de la que seleccionamos la
muestra. Suele ser desconocida. Hacemos inferencias sobre sus características, como los parámetros μy σ
que describen su centro y dispersión.
Distribución de datos de la muestra: esta es la distribución de datos que realmente
observamos; es decir, las observaciones muestrales. Podemos describirlo por estimadores como la media
muestral y y la desviación estándar muestral s. Cuanto mayor es el tamaño de la muestra n, más se
asemeja la distribución de datos de la muestra a la distribución de la población, y más cerca están los
estimadores muestrales como y de caer en los parámetros de población como μ.
Distribución muestral de un estimador: esta es la distribución de probabilidad para los posibles valores
de una estimador muestral, como y. Una distribución muestral describe la variación que ocurre en el
valor del estimador entre muestras de un cierto tamaño. Esta distribución determina la probabilidad de
que un estimador se encuentre dentro de una cierta distancia del parámetro poblacional que estima.
A diferencia de la distribución poblacional y la distribución de datos de la muestra, la distribución
muestral tiene forma acampanada.
Efecto del tamaño de la muestra en los datos de la muestra y las distribuciones muestrales
La distribución muestral se acerca a la forma normal para grandes valores de n. A medida que n aumenta,
la distribución muestral de y asume más una forma de campana. Para n≥30, la aproximación suele ser
buena. A medida que el tamaño de la muestra n se acerca al tamaño de la población N, la distribución
normal muestral de y se vuelve más estrecha y eventualmente converge a un pico en el número μ.
Cuando se muestrea toda la población, y =μ con probabilidad 1 y la distribución muestral se concentra en
el punto μ.
La diferencia entre la distribución de la población y la distribución muestral de y
También hay una gran diferencia entre distribución muestral de datos y la distribución de la muestra. La
distribución de los datos de muestra se parece mucho a la distribución de la población, y más aún a
medida que aumenta el tamaño de la muestra. La distribución muestral, por otro lado, tiene una apariencia
en forma de campana y se vuelve más estrecha a medida que aumenta n.
El papel clave de las distribuciones muestrales en la inferencia estadística

La mayoría de los estimadores muestrales que se utilizan para estimar los parámetros de población tienen
distribuciones de muestreo aproximadamente normales, para grandes muestras aleatorias. La razón
principal del papel clave de la distribución normal es que muchos estimadores tienen distribuciones de
muestreo aproximadamente normales.

Agresti y Finlay - Cap 4 (85-99)

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Agresti y Finlay - Cap 4 (85-99)

Cargado por

Copyright:

Formatos disponibles

AGRESTI Y FINLAY - CAP 4 (85-99)

LAS DISTRIBUCIONES DE MUESTREO DESCRIBEN CÓMO VARÍAN LAS ESTADÍSTICAS

DISTRIBUCIONES DE MUESTREO DE MEDIOS DE MUESTRA

REVISIÓN: POBLACIÓN, DATOS DE MUESTRA Y DISTRIBUCIONES DE MUESTREO

El papel clave de las distribuciones muestrales en la inferencia estadística

También podría gustarte