Está en la página 1de 24

Distribuciones muestrales.

Distribucin muestral de
Medias
Algunas secciones han sido modificadas de:
Apuntes de Estadstica, Mtra Leticia de la Torre
Instituto Tecnolgico de Chiuhuahua
TEORIA DEL MUESTREO TEORIA DEL MUESTREO
Uno de los propsitos de la estadstica inferencial es estimar las
caractersticas poblacionales desconocidas, examinando la
informacin obtenida de una muestra, de una poblacin. El punto de
inters es la muestra, la cual debe ser representativa de la poblacin
objeto de estudio.
Se seguirn ciertos procedimientos de seleccin para asegurar de que
las muestras reflejen observaciones a la poblacin de la que proceden,
ya que solo se pueden hacer observaciones probabilsticas sobre una
poblacin cuando se usan muestras representativas de la misma.
Una poblaci poblaci n n est formada por la totalidad de las observaciones en
las cuales se tiene cierto observa.
Una muestra muestra es un subconjunto de observaciones seleccionadas de
una poblacin.
El error muestral se refiere a la variacin natural existente entre
muestras tomadas de la misma poblacin. An si se ha tenido gran
cuidado para asegurar que dos muestras del mismo tamao sean
representativas de una cierta poblacin, no esperaramos que las dos
sean idnticas en todos sus detalles. El error muestral es un concepto
importante que ayudar a entender mejor la naturaleza de la
estadstica inferencial.
Errores en el Muestreo Errores en el Muestreo
Cuando se utilizan valores muestrales (parmetros), o estadsticos
para estimar valores poblacionales, pueden ocurrir dos tipos
generales de errores:
El error muestral y
El error no muestral.
Los errores que surgen al tomar las muestras y que no pueden clasificarse
como errores muestrales y se denominan errores no muestrales.
El sesgo de las muestras es un tipo de error no muestral. El sesgo
muestral se refiere a una tendencia sistemtica inherente a un mtodo de
muestreo que da estimaciones de un parmetro que son, en promedio,
menores (sesgo negativo), o mayores (sesgo positivo) que el parmetro
real. Ejemplo: la longitud del dedo ndice de personas de la misma edad y
sexo.
El sesgo muestral puede suprimirse, o minimizarse, usando la
aleatorizacin.
La aleatorizaci La aleatorizaci n n se refiere a cualquier proceso de seleccin de una
muestra de la poblacin en el que la seleccin es imparcial o no est
sesgada; una muestra elegida con procedimientos aleatorios se llama
muestra aleatoria muestra aleatoria.
Los tipos ms comunes de tcnicas de muestreo aleatorios son:
el muestreo aleatorio simple,
el muestreo estratificado,
el muestreo por conglomerados y
el muestreo sistemtico.
Si una muestra aleatoria se elige de tal forma que todos los elementos de
la poblacin tengan la misma probabilidad de ser seleccionados, la
llamamos muestra aleatoria simple.
Ejemplo 1
Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes
en un grupo de estadstica de 20 alumnos. Las combinaciones se escriben
20
C
5
lo que da el nmero total de formas de elegir una muestra no
ordenada y este resultado es igual a 15,504 maneras diferentes de
tomar la muestra. Un procedimiento simple para elegir una muestra
aleatoria sera escribir cada uno de los 20 nombres en pedazos
separados de papel, colocarlos en un recipiente, revolverlos y despus
extraer cinco papeles al mismo tiempo.
Otro mtodo parea obtener una muestra aleatoria de 5 estudiantes en un
grupo de 20 utiliza una tabla de nmeros aleatorios. Se puede construir
la tabla usando una calculadora o una computadora o con mtodos de
seleccin al azar.
Hay muchas situaciones en las cuales el muestreo aleatorio simple es
poco prctico, imposible o no deseado; aunque sera deseable usar
muestras aleatorias simples para las encuestas nacionales de opinin
sobre productos o sobre elecciones presidenciales, sera muy costoso o
tardado.
El muestreo estratificado requiere de separar a la poblacin segn
grupos que no se traslapen llamados estratos, y de elegir despus una
muestra aleatoria simple en cada estrato. La informacin de las
muestras aleatorias simples de cada estrato constituira entonces una
muestra global.
Ejemplo 2
Suponga que nos interesa obtener una muestra de las opiniones de los
profesores de una gran universidad. Puede ser difcil obtener una
muestra con todos los profesores, as que supongamos que elegimos
una muestra aleatoria de cada colegio, o departamento acadmico; los
estratos vendran a ser los colegios, o departamentos acadmicos.
El muestreo por conglomerados requiere de elegir una muestra
aleatoria simple de unidades heterogneas entre s de la poblacin
llamadas conglomerados. Cada elemento de la poblacin pertenece
exactamente a un conglomerado, y los elementos dentro de cada
conglomerado son usualmente heterogneos o dismiles.
Ejemplo 3
Suponga que una compaa de servicio de televisin por cable est
pensando en abrir una sucursal en una ciudad grande; la compaa
planea realizar un estudio para determinar el porcentaje de familias
que utilizaran sus servicios, como no es prctico preguntar en cada
casa, la empresa decide seleccionar una parte de la ciudad al azar, la
cual forma un conglomerado.
En el muestreo por conglomerados, stos se forman para representar,
tan fielmente como sea posible, a toda la poblacin; entonces se usa una
muestra aleatoria simple de conglomerados para estudiarla. Los
estudios de instituciones sociales como iglesias, hospitales, escuelas y
prisiones se realizan, generalmente, con base en el muestreo por
conglomerados.
El muestreo sistemtico es una tcnica de muestreo que requiere de una
seleccin aleatoria inicial de observaciones seguida de otra seleccin de
observaciones obtenida usando algn sistema o regla.
Ejemplo 4
Para obtener una muestra de suscriptores telefnicos en una ciudad
grande, puede obtenerse primero una muestra aleatoria de los nmeros
de las pginas del directorio telefnico; al elegir el vigsimo nombre de
cada pgina obtendramos un muestreo sistemtico, tambin podemos
escoger un nombre de la primera pgina del directorio y despus
seleccionar cada nombre del lugar nmero cien a partir del ya
seleccionado.
En este caso, podramos seleccionar un nmero al azar entre los primeros
100; supongamos que el elegido es el 40, entonces seleccionamos los
nombres del directorio que corresponden a los nmeros 40, 140, 240,
340 y as sucesivamente.
Las muestras aleatorias obtenidas de una poblacin son, por naturaleza
propia, impredecibles. No se esperara que dos muestras aleatorias del
mismo tamao y tomadas de la misma poblacin tenga la misma media
muestral o que sean completamente parecidas; puede esperarse que
cualquier estadstico, como la media muestral, calculado a partir de las
medias en una muestra aleatoria, cambie su valor de una muestra a otra,
por ello, se quiere estudiar la distribucin de todos los valores posibles
de un estadstico.
Tales distribuciones sern muy importantes en el estudio de la
estadstica inferencial, porque las inferencias sobre las poblaciones se
harn usando estadsticas muestrales.
Distribuciones Distribuciones Muestrales Muestrales
Con el anlisis de las distribuciones asociadas
con los estadsticos muestrales, podremos
juzgar la confiabilidad de un estadstico
muestral como un instrumento para hacer
inferencias sobre un parmetro poblacional
desconocido.
Como los valores de un estadstico, tal como
la media, varan de una muestra aleatoria a
otra, se le puede considerar como una
variable aleatoria con su correspondiente
distribucin de frecuencias.
La distribucin de frecuencia de un
estadstico muestral se denomina
distribucin muestral.
En general, la distribucin muestral de un
estadstico es la de todos sus valores
posibles calculados a partir de muestras del
mismo tamao.
Suponga que se han seleccionado muestras aleatorias de tamao
20 en una poblacin grande. Se calcula la media muestral x para
cada muestra; la coleccin de todas estas medias muestrales
recibe el nombre de distribucin muestral de medias, lo que se
puede ilustrar en la siguiente figura:
Distribucin Muestral de Medias
El Teorema del Lmite Central tambin nos indica que cuando se
extraen muestras de tamao mayor a 30 o bien de cualquier tamao
pero provenientes de una poblacin normal, la distribucin muestral de
medias tiene un comportamiento aproximadamente normal, por lo que
se puede utilizar la formula de la distribucin normal con
y
s, es equivalente al error estndar de la media, entonces la frmula
para calcular la probabilidad del comportamiento del estadstico, en
este caso la media de la muestra , quedara de la siguiente manera:
x =
s
n

=
x
z
n

=
Veamos como es que resulta el error estndar
Actividad 1.
Se eligen muestras de pares de nmeros, con reemplazo, de la poblacin de
los valores 0, 2, 4 y 6. Encontrar:
, la media poblacional.
s , la desviacin estndar poblacional.

x,
la media de la distribucin muestral de medias.
s
x
, la desviacin estndar de la distribucin muestral de medias.
Adems, graficar las frecuencias para la poblacin y para la distribucin
muestral de medias.
Nota: Usar muestras ordenadas implica todas las combinaciones de valores,
por ejemplo, (4,2) y (2,4) son dos parejas diferentes.
s
n

=
Sobre el Error Estndar
Solucin:
La media poblacional es:
3
4
6 4 2 0
=
+ + +
=
La desviacin estndar de la poblacional es:
236 . 2
4
) 3 6 ( ) 3 4 ( ) 3 2 ( ) 3 0 (
2 2 2 2
=
+ + +
=
La distribucin de
frecuencias de la
poblacin es una
distribucin uniforme.
la distribucin muestral de las medias es:
La media de la distribucin muestral de medias es:
0 1 1 2 2 3 3 4 4 3 5 2 6 1 48
3
16 16
( )
( )( ) ( )( ) ( )( ) ( )( ) ( )( ) ( )( ) ( )( )
x
fx
f

+ + + + + +
= = = =

La desviacin estndar de la distribucin muestral de medias es:


58 . 1
16
) 3 6 ( 1 ) 3 5 ( 2 ) 3 4 ( 3 ) 3 3 ( 4 ) 3 2 ( 3 ) 3 1 ( 2 ) 3 0 ( 1
) (
2 2 2 2 2 2 2
2
=
+ + + + + +
=

f
x f
x
x

2236
158
2
.
.
x
n

= = =
Notar que:
El teorema del lmite central y el error estndar de la media y de la
proporcin estn basados en que las muestras son seleccionadas con
reemplazo. Sin embargo, en virtualmente todos los casos reales, el
muestreo se hace sin reemplazo de poblaciones con tamao finito N.
En estos casos, y particularmente cuando el tamao de la muestra NO
ES PEQUEO en comparacin con el de la poblacin (por ejemplo, ms
del 5% de la poblacin) de manera que:
005 .
n
N
>
Siendo n el tamao de la muestra y N el de la poblacin. Entonces es
necesario emplear un Factor de Correccin para Poblacin Finita
para la desviacin estndar:
1

N
n N
La correccin modifica la ecuacin del estadstico de la siguiente
forma.
1
x
z
N n
N
n

Siendo n el tamao de la muestra y Nel de la poblacin.


Ejemplo 5:
Una empresa elctrica fabrica bateras que tienen una duracin que se
distribuye aproximadamente en forma normal, con media de 800 horas y
desviacin estndar de 40 horas. Encuentre la probabilidad de que una
muestra aleatoria de 16 bateras tenga una vida promedio de menos de
775 horas.
Solucin:
z =-2.5
La respuesta sera que la probabilidad de que la media de la muestra de
16 bateras sea menor a 775 horas es de 0.0062 o 0.62 %.
0.4
0.3
0.2
0.1
0.0
X
D
e
n
s
i
t
y
-2.5
0.00621
0
Distribution Plot
Normal, Mean=0, StDev=1
rea = 0.0062
Ejemplo 6.
Las estaturas de 1000 estudiantes estn distribuidas
aproximadamente en forma normal con una media de 174.5
centmetros y una desviacin estndar de 6.9. centmetros. Si se
extraen 200 muestras aleatorias de tamao 25 sin reemplazo de esta
poblacin, determine:
a) El nmero de las medias muestrales que caen entre 172.5 y 175.8
centmetros.
b) El nmero de medias muestrales que caen por debajo de 172
centmetros.
Solucin:
Como n/N=200/1000=0.2, se puede observar en este ejercicio se
cuenta con una poblacin finita y un muestreo sin reemplazo, por lo
que se tendr que agregar el factor de correccin. Se proceder a
calcular el denominador de Z para slo sustituirlo en cada inciso.
a)
Por lo tanto la respuesta es:
(0.761)(200)=152 medias muestrales
0.4
0.3
0.2
0.1
0.0
X
D
e
n
s
i
t
y
-1.47
0.761
0 0.96
Distribution Plot
Normal, Mean=0, StDev=1
rea = 0.761
0.30
0.25
0.20
0.15
0.10
0.05
0.00
X
D
e
n
s
i
t
y
172
0.0330
175
Distribution Plot
Normal, Mean=174.5, StDev=1.36
0.4
0.3
0.2
0.1
0.0
X
D
e
n
s
i
t
y
-1.8382
0.0330
0
Distribution Plot
Normal, Mean=0, StDev=1
b)
Por lo tanto la respuesta es:
(0.0330)(200)= 7 medias muestrales
rea = 0.0330
Nota: Es lo mismo si se toman los valores
originales con la distribucin para la media y
desviacin estndar correspondientes, pero esto
slo se puede efectuar con software y no con
tablas.

También podría gustarte