Está en la página 1de 33

UNIVERSIDAD MESOAMERICANA

ESCUELA SUPERIOR DE ALTA GERENCIA


ESTADSTICA APLICADA

Distribuciones
muestrales
TEORA ELEMENTAL DE MUESTREO

MAYO 2015

El propsito del muestreo es examinar una

poblacin a partir de una muestra; esto


genera la informacin necesaria para estimar
los parmetros (media poblacional, varianza
poblacional y proporcin poblacional, por
ejemplo).
Si los parmetros no son estimados, entonces

debern ser determinados por medio de un


censo.

Determinar o estimar?
Se puede determinar un valor estadstico

cuando se cuenta con la totalidad de los


datos, en este caso el proceso ser con
estadstica descriptiva.
Se puede estimar un valor estadstico, cuando

no se cuenta con la totalidad de los datos y en


este caso el proceso se hace con
herramientas de estadstica inferencial.

Estadsticos y
parmetros
El estadstico es el valor representativo de

una caracterstica en una muestra, como la


media muestral, la desviacin estndar
muestral s, o la proporcin muestral p.
El parmetro es el valor representativo de una

caracterstica en una poblacin, como la


media poblacional la desviacin estndar
poblacional o la proporcin poblacional P .

Cmo se estiman los parmetros?


Antes de responder a esta pregunta, debemos

necesariamente revisar algunos aspectos de


la teora elemental de muestreo.
Para el efecto considere un caso hipottico de

cierta poblacin con un tamao N = 10000, de


la cual se extrae una muestra de tamao
n=100.

POBLACIN N = 10000

La muestra nos dar una media muestral,


cuyo valor no podemos tener la certeza
que sea igual al valor de , por qu?
Medite un momento antes de continuar.

Analicemos lo siguiente: Usted al tomar 100

elementos de muestra de hecho ha tomado


una centsima parte de N, es decir que podra
haber tomado otras 99 muestras distintas.
Suponga que usted toma otra muestra

diferente de 100 elementos, la media


muestral obtenida, difcilmente ser igual a la
de la primera muestra, es decir

Si continuramos obteniendo muestras de

tamao 100, tendramos cien medias


muestrales (seguramente muchas distintas,
dado que los datos son variables)

POBLACIN N = 10000

Piense un
momento en
esto:
cul de todas
las medias
muestrales
posibles , (en
este caso 100)
est ms
prxima al valor
de la media
poblacional?

POBLACIN N = 10000

No hay forma de
saberlo!
Cuando se estima el
valor del parmetro
se obtiene solo
una muestra de la
poblacin, es
probable que el
valor de la media
muestral x
obtenida, se
aproxime a .
A esta probabilidad
se le denomina
error de muestreo
(E) y es
fundamental para

Entonces como se
estiman los parmetros?
Un parmetro se estima a partir del valor de

un estadstico como la media de muestra, ms


o menos el error de muestreo, o de la
proporcin de muestra, ms o menor el error
de muestreo.
= x E
P = p E
Ahora veamos cmo se determinan los

errores de muestreo.

Para poder calcular el error de muestreo (E ),

necesitamos definir qu es la

Distribucin muestral de
medias
Al

ordenarse (tericamente) las medias


muestrales
de
las
que
hablamos
anteriormente, se da lugar a lo que se
denomina distribucin muestral de medias; y
ocurre que si la poblacin original est
distribuida normalmente, es decir que si la
variable es normal, la distribucin de las
medias muestrales tambin ser normal.

En esta distribucin, la media de las


medias muestrales resulta ser y la
desviacin estndar se denomina error
estndar de la media (x)

Lo anterior ocurre siempre que los datos

originales sean normales, sin importar el


tamao de la muestra; sin embargo Qu
ocurre si los datos no son normales?
Afortunadamente existe un teorema

fundamental en la estimacin, el denominado


Teorema del lmite central, el cual establece lo
siguiente:
A medida que n se vuelve ms grande, la
distribucin de las medias muestrales se
aproxima a una distribucin normal, con una
media de medias igual a y desviacin

La relevancia de este teorema, es que aunque

los datos originales no sean normales, la


distribucin de las medias muestrales , si n es
grande, (n 30) es una distribucin normal.
Habiendo explicado lo que es una distribucin

muestral de medias, veamos qu es el error


de muestreo: regresemos al ejemplo
hipottico de la poblacin de N=10000 de
donde se extrajeron 100 muestras de tamao
n=100.
Las medias muestrales se dispondrn en una

forma normal de acuerdo al teorema del lmite

La diferencia promedio entre cada


media muestral y la media poblacional,
nos dira qu tanto esperamos que se
desven las medias muestrales de la
media real

este valor es la desviacin estndar


de una distribucin muestral de medias,
y se conoce como error tpico o error
estndar de la media y su smbolo es x
o bien sx, la diferencia se explicar

Ahora considere lo siguiente: Si las medias

muestrales tienen una distribucin normal, la


diferencia entre el valor de la media
poblacional y una media muestral en
particular, se calculara as:
Siendo Z = x

Sx

Entonces:Sx= x
y:

ZSx = E
x

Esta distancia es en s el error de muestreo, es decir una


diferencia entre el valor de la media poblacional y una
media muestral.

Cuando se hace un muestreo, el investigador

no tiene idea de qu tan distante est su


media muestral, de la media real ni tampoco
si es superior o inferior a ella, pero puede
asumir que est tan lejos como la del
diagrama, digamos a 2 distancias Z.

Entonces al calcular el error de muestreo con

2 distancias estndar, el 95.44% de todas las


medias muestrales posibles tendran una
diferencia menor a ste error.

La conclusin a esto es que solamente que su

media de muestra est muy lejos de la media


real ms all de 2 distancias Z arriba o abajo,
entonces el intervalo no contendr a la media
muestral.
Vea el siguiente esquema y analice que todas

los intervalos generados con medias entre


2Z, contendrn a la media poblacional , es
decir el 95.44% de las medias posibles.

Finalmente, si a la media muestral que se

obtiene en un muestreo, se le suma y se le


resta* el valor de un error de muestreo
calculado con un valor Z de 2 que cubre el
95.44% de todas las medias, se generar un
rango o intervalo, el que se denomina
intervalo de confianza al 95.44%.
95.44% = x E
95.44% = x ZSx
95.44% = x 2 Sx
* (suma y resta porque no se sabe si la media
muestral es mayor o menor que la media

El error estndar de la media se calcula

dividiendo la desviacin estndar entre la raiz


cuadrada del tamao de muestra.
Cuando se conoce la desviacin estndar
poblacional se debe priorizar su uso para el
clculo, entonces su smbolo ser x = n.
Si solo se cuenta con la desviacin estndar
muestral, entonces la frmula ser sx= s/n .

Cmo se interpretan los


intervalos de confianza?
Un intervalo de confianza por ejemplo al 95%

significar que se tiene un 95% de confianza


en que la media poblacional real desconocida,
est en el intervalo.
Tambin se puede interpretar que si se

pueden desarrollar muchos intervalos de


confianza, en el 95% de los casos, los
intervalos contendrn a la media poblacional
real.

Niveles de confianza mas


usados
Los niveles de confianza que se utilizan

ms frecuentemente son tres al 90%, 95% y


99%, y los valores de Z correspondientes
son: 1.64, 1.96 y 2.58.

Otros valores de Z para


IC
91%
92%
93%
94%
96%
97%
98%

=
=
=
=
=
=
=

1.70
1.75
1.81
1.88
2.05
2.17
2.33

Muestreo de
proporciones
Aunque ac se desarroll el tema con medias

muestrales y la media poblacional, lo mismo


se aplica cuando se tienen proporciones
muestrales y la proporcin poblacional, donde
P = p E
E = Z Sp

proporcin
Sp = (pq/n)

Sp = Error estndar de la

La distribucin de las proporciones

muestrales tambin se convierte en una


distribucin normal cuando n> 30. Sin
embargo, esto no se debe al teorema del
lmite central, sino a la propiedad que tiene
una distribucin binomial de aproximarse a
una distribucin normal, cuando se tiene una
muestra grande.
El error de muestreo se calcula tambin con

valores Z que multiplica a la distancia


promedio de las proporciones muestrales, con
la proporcin real.

p-E
p-E
p-E

p+E

p+E
p-E

p-E

p+E

p+E

p+E

Las muestras pequeas


Hemos explicado que el error de muestreo se

calcula utilizando distribucin normal (valores


Z), siempre que las muestras sean grandes,
qu ocurre cuando se trabaja con muestras
pequeas?.
La respuesta es: para estimar la proporcin

poblacional, no se pueden utilizar muestras


pequeas, por lo tanto siempre se usar Z
para estimar intervalos de confianza para la
proporcin.

Por otra parte, para estimar la media

poblacional con muestras pequeas, es


necesario en primer lugar, que la variable
investigada se distribuya normalmente y
luego dependiendo si se tiene la desviacin
estndar poblacional o muestral, el error de
muestreo se calcula as:
E = Zx (si se tiene la desviacin estndar

poblacional y la variable se distribuye


normalmente, entonces se puede utilizar Z.

E = tsx (si solo se tiene la desviacin

estndar muestral y la variable se distribuye


normalmente, entonces se deben utilizar los
valores t, de la distribucin t de Student.
Si se tienen muestras pequeas y la variable

no se distribuye normalmente, no es posible


calcular los intervalos de confianza para la
media, aunque existe un procedimiento, no se
explicar ac, porque tiende a dar errores de
muestreo muy grandes.

También podría gustarte