Distribuciones Muestrales

UNIVERSIDAD MESOAMERICANA
ESCUELA SUPERIOR DE ALTA GERENCIA

ESTADSTICA APLICADA
Distribuciones
muestrales
TEORA ELEMENTAL DE MUESTREO
MAYO 2015
El propsito del muestreo es examinar una
poblacin a partir de una muestra; esto

genera la informacin necesaria para estimar
los parmetros (media poblacional, varianza
poblacional y proporcin poblacional, por
ejemplo).
Si los parmetros no son estimados, entonces
debern ser determinados por medio de un

censo.
Determinar o estimar?
Se puede determinar un valor estadstico
cuando se cuenta con la totalidad de los

datos, en este caso el proceso ser con
estadstica descriptiva.
Se puede estimar un valor estadstico, cuando
no se cuenta con la totalidad de los datos y en

este caso el proceso se hace con
herramientas de estadstica inferencial.
Estadsticos y
parmetros
El estadstico es el valor representativo de
una caracterstica en una muestra, como la

media muestral, la desviacin estndar
muestral s, o la proporcin muestral p.
El parmetro es el valor representativo de una
caracterstica en una poblacin, como la

media poblacional la desviacin estndar
poblacional o la proporcin poblacional P .
Cmo se estiman los parmetros?

Antes de responder a esta pregunta, debemos
necesariamente revisar algunos aspectos de

la teora elemental de muestreo.
Para el efecto considere un caso hipottico de
cierta poblacin con un tamao N = 10000, de

la cual se extrae una muestra de tamao
n=100.
POBLACIN N = 10000
La muestra nos dar una media muestral,

cuyo valor no podemos tener la certeza
que sea igual al valor de , por qu?
Medite un momento antes de continuar.
Analicemos lo siguiente: Usted al tomar 100
elementos de muestra de hecho ha tomado

una centsima parte de N, es decir que podra
haber tomado otras 99 muestras distintas.
Suponga que usted toma otra muestra
diferente de 100 elementos, la media

muestral obtenida, difcilmente ser igual a la
de la primera muestra, es decir
Si continuramos obteniendo muestras de
tamao 100, tendramos cien medias

muestrales (seguramente muchas distintas,
dado que los datos son variables)
POBLACIN N = 10000
Piense un
momento en
esto:
cul de todas
las medias
muestrales
posibles , (en
este caso 100)
est ms
prxima al valor
de la media
poblacional?
POBLACIN N = 10000
No hay forma de
saberlo!
Cuando se estima el
valor del parmetro
se obtiene solo
una muestra de la
poblacin, es
probable que el
valor de la media
muestral x
obtenida, se
aproxime a .
A esta probabilidad
se le denomina
error de muestreo
(E) y es
fundamental para
Entonces como se
estiman los parmetros?
Un parmetro se estima a partir del valor de
un estadstico como la media de muestra, ms

o menos el error de muestreo, o de la
proporcin de muestra, ms o menor el error
de muestreo.
= x E
P = p E
Ahora veamos cmo se determinan los
errores de muestreo.
Para poder calcular el error de muestreo (E ),
necesitamos definir qu es la
Distribucin muestral de
medias
Al
ordenarse (tericamente) las medias

muestrales
de
las
que
hablamos
anteriormente, se da lugar a lo que se
denomina distribucin muestral de medias; y
ocurre que si la poblacin original est
distribuida normalmente, es decir que si la
variable es normal, la distribucin de las
medias muestrales tambin ser normal.
En esta distribucin, la media de las

medias muestrales resulta ser y la
desviacin estndar se denomina error
estndar de la media (x)
Lo anterior ocurre siempre que los datos
originales sean normales, sin importar el

tamao de la muestra; sin embargo Qu
ocurre si los datos no son normales?
Afortunadamente existe un teorema
fundamental en la estimacin, el denominado

Teorema del lmite central, el cual establece lo
siguiente:
A medida que n se vuelve ms grande, la
distribucin de las medias muestrales se
aproxima a una distribucin normal, con una
media de medias igual a y desviacin
La relevancia de este teorema, es que aunque
los datos originales no sean normales, la

distribucin de las medias muestrales , si n es
grande, (n 30) es una distribucin normal.
Habiendo explicado lo que es una distribucin
muestral de medias, veamos qu es el error

de muestreo: regresemos al ejemplo
hipottico de la poblacin de N=10000 de
donde se extrajeron 100 muestras de tamao
n=100.
Las medias muestrales se dispondrn en una
forma normal de acuerdo al teorema del lmite
La diferencia promedio entre cada

media muestral y la media poblacional,
nos dira qu tanto esperamos que se
desven las medias muestrales de la
media real
este valor es la desviacin estndar

de una distribucin muestral de medias,
y se conoce como error tpico o error
estndar de la media y su smbolo es x
o bien sx, la diferencia se explicar
Ahora considere lo siguiente: Si las medias
muestrales tienen una distribucin normal, la

diferencia entre el valor de la media
poblacional y una media muestral en
particular, se calculara as:
Siendo Z = x
Sx
Entonces:Sx= x
y:
ZSx = E
x
Esta distancia es en s el error de muestreo, es decir una

diferencia entre el valor de la media poblacional y una
media muestral.
Cuando se hace un muestreo, el investigador
no tiene idea de qu tan distante est su

media muestral, de la media real ni tampoco
si es superior o inferior a ella, pero puede
asumir que est tan lejos como la del
diagrama, digamos a 2 distancias Z.
Entonces al calcular el error de muestreo con
2 distancias estndar, el 95.44% de todas las

medias muestrales posibles tendran una
diferencia menor a ste error.
La conclusin a esto es que solamente que su
media de muestra est muy lejos de la media

real ms all de 2 distancias Z arriba o abajo,
entonces el intervalo no contendr a la media
muestral.
Vea el siguiente esquema y analice que todas
los intervalos generados con medias entre

2Z, contendrn a la media poblacional , es
decir el 95.44% de las medias posibles.
Finalmente, si a la media muestral que se
obtiene en un muestreo, se le suma y se le

resta* el valor de un error de muestreo
calculado con un valor Z de 2 que cubre el
95.44% de todas las medias, se generar un
rango o intervalo, el que se denomina
intervalo de confianza al 95.44%.
95.44% = x E
95.44% = x ZSx
95.44% = x 2 Sx
* (suma y resta porque no se sabe si la media
muestral es mayor o menor que la media
El error estndar de la media se calcula
dividiendo la desviacin estndar entre la raiz

cuadrada del tamao de muestra.
Cuando se conoce la desviacin estndar
poblacional se debe priorizar su uso para el
clculo, entonces su smbolo ser x = n.
Si solo se cuenta con la desviacin estndar
muestral, entonces la frmula ser sx= s/n .
Cmo se interpretan los

intervalos de confianza?
Un intervalo de confianza por ejemplo al 95%
significar que se tiene un 95% de confianza

en que la media poblacional real desconocida,
est en el intervalo.
Tambin se puede interpretar que si se
pueden desarrollar muchos intervalos de

confianza, en el 95% de los casos, los
intervalos contendrn a la media poblacional
real.
Niveles de confianza mas

usados
Los niveles de confianza que se utilizan
ms frecuentemente son tres al 90%, 95% y

99%, y los valores de Z correspondientes
son: 1.64, 1.96 y 2.58.
Otros valores de Z para

IC
91%
92%
93%
94%
96%
97%
98%
=
=
=
=
=
=
=
1.70
1.75
1.81
1.88
2.05
2.17
2.33
Muestreo de
proporciones
Aunque ac se desarroll el tema con medias
muestrales y la media poblacional, lo mismo

se aplica cuando se tienen proporciones
muestrales y la proporcin poblacional, donde
P = p E
E = Z Sp
proporcin
Sp = (pq/n)
Sp = Error estndar de la
La distribucin de las proporciones
muestrales tambin se convierte en una

distribucin normal cuando n> 30. Sin
embargo, esto no se debe al teorema del
lmite central, sino a la propiedad que tiene
una distribucin binomial de aproximarse a
una distribucin normal, cuando se tiene una
muestra grande.
El error de muestreo se calcula tambin con
valores Z que multiplica a la distancia

promedio de las proporciones muestrales, con
la proporcin real.
p-E
p-E
p-E
p+E
p+E
p-E
p-E
p+E
p+E
p+E
Las muestras pequeas

Hemos explicado que el error de muestreo se
calcula utilizando distribucin normal (valores

Z), siempre que las muestras sean grandes,
qu ocurre cuando se trabaja con muestras
pequeas?.
La respuesta es: para estimar la proporcin
poblacional, no se pueden utilizar muestras

pequeas, por lo tanto siempre se usar Z
para estimar intervalos de confianza para la
proporcin.
Por otra parte, para estimar la media
poblacional con muestras pequeas, es

necesario en primer lugar, que la variable
investigada se distribuya normalmente y
luego dependiendo si se tiene la desviacin
estndar poblacional o muestral, el error de
muestreo se calcula as:
E = Zx (si se tiene la desviacin estndar
poblacional y la variable se distribuye

normalmente, entonces se puede utilizar Z.
E = tsx (si solo se tiene la desviacin
estndar muestral y la variable se distribuye

normalmente, entonces se deben utilizar los
valores t, de la distribucin t de Student.
Si se tienen muestras pequeas y la variable
no se distribuye normalmente, no es posible

calcular los intervalos de confianza para la
media, aunque existe un procedimiento, no se
explicar ac, porque tiende a dar errores de
muestreo muy grandes.

Distribuciones Muestrales

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Distribuciones Muestrales

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD MESOAMERICANA

ESCUELA SUPERIOR DE ALTA GERENCIA

El propsito del muestreo es examinar una

poblacin a partir de una muestra; esto

debern ser determinados por medio de un

cuando se cuenta con la totalidad de los

no se cuenta con la totalidad de los datos y en

una caracterstica en una muestra, como la

caracterstica en una poblacin, como la

Cmo se estiman los parmetros?

necesariamente revisar algunos aspectos de

cierta poblacin con un tamao N = 10000, de

La muestra nos dar una media muestral,

Analicemos lo siguiente: Usted al tomar 100

elementos de muestra de hecho ha tomado

diferente de 100 elementos, la media

Si continuramos obteniendo muestras de

tamao 100, tendramos cien medias

un estadstico como la media de muestra, ms

Para poder calcular el error de muestreo (E ),

ordenarse (tericamente) las medias

En esta distribucin, la media de las

Lo anterior ocurre siempre que los datos

originales sean normales, sin importar el

fundamental en la estimacin, el denominado

La relevancia de este teorema, es que aunque

los datos originales no sean normales, la

muestral de medias, veamos qu es el error

forma normal de acuerdo al teorema del lmite

La diferencia promedio entre cada

este valor es la desviacin estndar

Ahora considere lo siguiente: Si las medias

muestrales tienen una distribucin normal, la

Esta distancia es en s el error de muestreo, es decir una

Cuando se hace un muestreo, el investigador

no tiene idea de qu tan distante est su

Entonces al calcular el error de muestreo con

2 distancias estndar, el 95.44% de todas las

La conclusin a esto es que solamente que su

media de muestra est muy lejos de la media

los intervalos generados con medias entre

Finalmente, si a la media muestral que se

obtiene en un muestreo, se le suma y se le

El error estndar de la media se calcula

dividiendo la desviacin estndar entre la raiz

Cmo se interpretan los

significar que se tiene un 95% de confianza

pueden desarrollar muchos intervalos de

Niveles de confianza mas

ms frecuentemente son tres al 90%, 95% y

Otros valores de Z para

muestrales y la media poblacional, lo mismo

La distribucin de las proporciones

muestrales tambin se convierte en una

valores Z que multiplica a la distancia

Las muestras pequeas

calcula utilizando distribucin normal (valores

poblacional, no se pueden utilizar muestras

Por otra parte, para estimar la media

poblacional con muestras pequeas, es

poblacional y la variable se distribuye

E = tsx (si solo se tiene la desviacin

estndar muestral y la variable se distribuye