Está en la página 1de 25

GILBERTH PESANTES CALDERON

MUESTREO Y
DISTRIBUCIONES
MUESTRALES
TIPOS DE MUESTREO
A. MUESTREO PROBABILSTICO. Cuando cada unidad o
elemento de la poblacin tienen una determinada probabilidad de
ser incluida en la muestra. Los principales muestreos de este tipo
son:
A1. MUESTREO ALEATORIO SIMPLE (M.A.S.).
Cuando todos y cada uno de los elementos de la poblacin tienen igual
probabilidad debe ser incluidos en la muestra.

Ventajas
Sencillo y de fcil comprensin
Clculo rpido de las medias y varianzas

Desventajas
Se requiere de antemano un listado completo de toda la poblacin
Cuando se trabaja con muestras pequeas es posible que no
represente a la poblacin adecuadamente
MUESTREO ESTRATIFICADO
A2. MUESTREO ESTRATIFICADO.
El procedimiento consiste en dividir a la poblacin en grupos llamados
Estratos. Dentro de cada estrato los elementos deber ser lo mas
homogneo posibles con respecto a las caractersticas de la(s) variable(s)
en estudio. Los estratos deben ser homogneos dentro de s y
heterogneos entre ellos

Ventajas
Tiende a asegurar que la muestra represente adecuadamente a la
poblacin en funcin de las variables seleccionadas
Se obtiene estimaciones mas precisas.

Desventajas
Se ha de conocer la distribucin en la poblacin de las variables
utilizadas para la estratificacin
Los anlisis son complicados, en muchos casos la muestra tiene que
ponderarse (asignar pesos a cada elemento)

MUESTREO SITEMTICO
A3. MUESTREO SISTEMTICO: (K=N/n).
Es un procedimiento de seleccin por el cual el primer elemento de la
muestra es elegida al azar entre las K primeras unidades poblacionales
y luego el resto de las unidades se seleccionan cada K-sima unidad o
elemento de la poblacin.

Ventajas
Rapidez y facilidad de seleccin de la muestra
No siempre es necesario tener un listado de toda la poblacin
Cuando la poblacin est ordenada siguiendo una tendencia conocida,
asegura una cobertura de unidades de toda la poblacin
El error de muestreo suele ser menor que el M.A.S. e incluso que el del
estratificado.

Desventajas
La posibilidad de aumento en la varianza si existe periodicidad en la
poblacin.
En general slo hay seleccin aleatoria para la primera unidad de la
muestra.
MUESTREO POR CONGLOMERADOS
A4. MUESTREO POR CONGLOMERADOS.
Es un sistema de muestreo en el que las unidades de anlisis de la
poblacin se consideran conglomerados o unidades primarias. Se
considera como unidad de muestreo al conglomerado y extraemos una
muestra de conglomerados a partir del cual se estimar los parmetros
poblacionales. El nmero de unidades elementales se denomina tamao
del conglomerado. Los conglomerados deben ser heterogneos dentro de
s y homogneos entre ellos.
Ventajas
*Es muy eficiente cuando la poblacin es muy grande y dispersa
*Reduce costos.
*No es necesario tener un listado de toda la poblacin, solo de las
unidades primarias.
*Se puede utilizar como marco como reas geogrficas cuyas
caractersticas ya estn ya muy delimitas.
Desventajas
*Menor precisin de las estimaciones
*El Error estndar es mayor que el M.A.S. o sistemtico
*El clculo del error estndar es complejo.
MUESTREO NO PROBABILISTICO
B. MUESTREO NO PROBABILSTICO. Se basa en opinin
(criterio o juicio) personal del investigador. Aqu se desconoce la
probabilidad de las unidades seleccionadas y no se puede
construir intervalos de confianza de los estimadores, solo sepuede
hacer estimaciones puntuales. Los Muestreos no probabilsticos
pueden ser:

B1.Muestreo a juicio, intencional u opintico.
Donde los elementos se seleccionan a juicio o en opinin del
investigador; se podra decir que prima la intencin de que estas
unidades sean incluidas dentro de la muestra.

B2. Muestreo por conveniencia.
Se eligen los elementos que estn ms al alcance del investigador.
Muestreo voluntario. El informante, voluntariamente,
suministra informacin sin ser seleccionado.
Muestreo por cuota. Es un nmero de entrevistas cuotas
que se le fijan al encuestador para que a su vez seleccione los
elementos en la forma que considere oportuno.

ESTADISTICO Y SU DISTRIBUCION
Definicin. Supongamos que se ha extrado una muestra
aleatoria de una poblacin y que se desea hacer inferencia sobre
ciertas caractersticas de la distribucin de la poblacin. Esta
inferencia se basar en algn ESTADSTICO MUESTRAL, es
decir, en alguna funcin particular de la informacin muestral.
Definicin. La distribucin de un estadstico muestral recibe el
nombre de DISTRIBUCION MUESTRAL O DISTRIBUCION EN
EL MUESTREO y se define como la distribucin de
probabilidades de los valores que puede tomar el estadstico a lo
largo de todas las posibles muestras con el mismo nmero de
observaciones que pueden ser extradas de la poblacin.
DISTRIBUCION MUESTRAL DE
LA MEDIA
Supongamos que la poblacin en donde se hace el muestreo
es finita de tamao N.
Cuando el muestreo se hace con reemplazo, entonces:
La media de la distribucin muestral es igual a la media
de la poblacin en que se toma la muestra, es decir,
La varianza de la distribucin muestral es igual a la
varianza de la poblacin dividida por el tamao de la muestra,
es decir,
X

X
X
=
2
X
o
2
2
X
n
o
o =
Cuando el muestreo se hace sin reemplazo, entonces:
La media de la distribucin muestral es igual a la media
de la poblacin en que se toma la muestra, es decir,

La varianza de la distribucin muestral es igual a

2
2
1
X
N n
n N
o
o
| |
| |
=
| |

\ .
\ .
Ejemplo. Supongamos una poblacin de tamao 3 con valores 0, 2 y 4, se
eligen muestras de tamao 2.
a. Si el muestreo se hace con reemplazo.
b. Si el muestreo es sin reemplazo.
y cuando la poblacin es normal con conocida.
X

2
X
o
2
o
X
=
Poblacin finita Poblacin infinita
Muestreo con
reemplazo

Muestreo sin
reemplazo



2
2
X
n
o
o =
2
2
X
n
o
o =
2
2
1
X
N n
n N
o
o
| |

| |
=
| |

\ .
\ .
2
2
X
n
o
o =
El caso para muestras grandes
En este caso, denominaremos la forma de la distribucin
muestral de la media muestral suponiendo que se cumple
alguna de tres condiciones:
La poblacin es normal con varianza conocida.
La poblacin es normal con varianza desconocida y el
tamao de la muestra es grande.
La forma de la poblacin es desconocida (o no normal), su
varianza es conocida o desconocida y el tamao de la
muestra es grande.
Definicin. Sea la media de una muestra aleatoria de tamao
n tomada de una poblacin con media y varianza .
Supongamos que se cumple alguna de las siguientes condiciones:
a. La poblacin es normal y la varianza es conocida (no importa
el tamao de n).
b. La poblacin es normal, con varianza desconocida y n=>30.
c. La forma de la poblacin es desconocida (o no normal), la
varianza es conocida o desconocida y n=>30.
Entonces la v.a. tendr una distribucin normal con media 0 y
varianza 1.
X

2
0 o >
X
X
X
Z

o

=
Ejemplo. Supongamos que el incremento porcentual de los
salarios de los funcionarios de todas las corporaciones
medianas se distribuyen siguiendo una normal con media
12.2% y desviacin tpica 3.6%. Si se toma una muestra
aleatoria de nueve observaciones de esta poblacin segn
los incrementos porcentuales de salario. Cul es la
probabilidad de que la media muestral sea mayor del 10%?
Qu este entre un 9% y 11%?
Distribucin muestral de la media
muestral para muestras pequeas
Definicin. Si el muestreo se hace en una poblacin normal con
varianza desconocida y si las muestras seleccionadas son de
tamao n < 30, entonces, la distribucin muestral de la media
muestral es la t de Student con n-1 grados de libertad.
X
X
X
X
t

o

=
Ejemplo. Suponga que una poblacin normal con media 20 se toma una
muestra de tamao 16. Si la desviacin estndar muestral es 4, encuentre
la probabilidad de que la media muestral sea estrictamente mayor que
21,753.
Distribucin muestral de una proporcin
Definicin. Sea X el nmero de xitos en una muestra binomial de n
observaciones, donde la probabilidad de xito es p. Entonces, la
proporcin de xitos en la muestra recibe el nombre de
PROPORCION MUESTRAL.
x
p
n
=
Media y varianza de proporciones muestrales
( ) ( ) ( )
1 E X np y V X np p = =
( )
( )
( )
( )
( )
2
2
1
1
1
p
x
E p E E X p
n n
p p
x
V p V V X
n n n

o
| |
= = = =
|
\ .

| |
= = = =
|
\ .
Con esto obtenemos que:
Si el nmero N de individuos en la poblacin no es demasiado
grande, comparado con el nmero de individuos de la muestra,
ser necesaria una CORRECCION POR POBLACION FINITA en
la expresin de la varianza de la proporcin muestral. La varianza
ser entonces:
( )
2
1
1
p
p p
N n
N n
o
| |

| |
=
|
|

\ .
\ .
Sea la proporcin de xitos en una muestra aleatoria de n
observaciones. Si se cumple alguna de las dos condiciones
siguientes:
n=>30 o
Np=>5 y n(1-p)=>5.
Entonces la distribucin muestral de la proporcin se puede
aproximar a una distribucin normal.
p
p
p
p
p
Z

o

=
Ejemplo. Se toma una muestra de 250 casas de una poblacin de
edificios antiguos para estimar la proporcin de casas de este tipo
cuya instalacin elctrica resulta insegura. Supongamos que, de
hecho, el 30% de los edificios de esta poblacin tiene una instalacin
insegura. Cul es la probabilidad de que la proporcin de edificios
de la muestra con instalacin insegura se encuentre entre 0,25 y
0,35?
Distribucin muestral de la diferencia
de dos proporciones
( ) ( ) ( )
( ) ( ) ( )
( ) ( )
( )
( )
( ) ( )
1 2 1 2 1 2
1 1 2 2
1 2 1 2
1 2
1 2 1 2
1 1 2 2
1 2
1 1
1 1
E p p E p E p p p
p p p p
V p p V p V p
n n
p p p p
Z
p p p p
n n
= =

= + = +

=

+
Ejemplo. Los hombres y mujeres adultos radicados en una ciudad grande de
cierto pas difieren en sus opiniones sobre el establecimiento de la pena de
muerte para personas culpables de asesinato. Se cree que el 12% de los
hombres adultos estn a favor de la pena de muerte, mientras que solo el 10%
de las mujeres adultas lo estn. Si se pregunta a dos muestras aleatorias, una de
150 hombres y otra de 100 mujeres, su opinin al respecto, determine la
probabilidad de que el porcentaje de los hombres a favor sea al menos 3%
mayor que el de mujeres.
Distribucin muestral de diferencia de medias
Datos pareados (muestras dependientes)
Estadstico Media Varianza
D X Y = 1 2 D
=
2
2
d
D
s
n
o =

D
D
D
t

o

=
Ejemplo. La tabla siguiente una muestra aleatorirecoge los datos de consumo de
gasolina correspondientes aa de 8 automviles americanos de dos modelos
diferentes. Se formaron pares con las dos muestras y cada elemento de un
determinado par fue conducido por la misma ruta y por el mismo piloto:
xi (auto A) 19,4 18,8 20,6 17,6 19,2 20,9 18,3 20,4
yi (auto B) 19,6 17,5 18,4 17,5 18,0 20,0 18,8 19,2
a. Determine la media y la desviacin muestral de las diferencias en el consumo.
b. Suponiendo que la distribucin de las diferencias poblacionales es normal con
media -0,807, encuentre la probabilidad de que el consumo promedio de
gasolina del auto A sea mayor que el del auto B.
Muestras Independientes
Primer Caso. Varianza poblacionales conocidas o desconocidas
y muestras grandes.
( ) ( ) ( )
( ) ( ) ( )
( )
( )
1 2 1 2 1 2
2 2
1 2
1 2 1 2
1 2
1 2 1 2
2 2
1 2
1 2
E X X E X E X
V X X V X V X
n n
X X
Z
n n

o o

o o
= =
= + = +

=
+
Ejemplo. Para comparar los pesos promedios de nios y nias del sexto grado en una escuela
de instruccin media, se usar una muestra aleatoria de 20 nios y otra igual de 25 nias. Se
sabe que, en nios y nias, los pesos siguen una distribucin normal. En concreto, el
promedio de los pesos de todos los nios de sexto grado de esa escuela es de 100 libras y su
desviacin estndar es de 14,142, mientras que el promedio de los pesos de todas las nias es
de 85 libras y su desviacin es de 12,247. Encuentre la probabilidad de que el promedio de
los pesos de los 20 nios sea al menos 20 libras ms grande que el de las nias.
Segundo caso: varianzas poblacionales desconocidas,
iguales y muestras pequeas.
( )
( )
( ) ( )
1 2 1 2
1 2
2 2
1 2
2 2
1 1 2 2 2
1 2
; 2 .
1 1
2
X X
t con n n grados de libertad
s s
n n
n s n s
s
n n

= +
+
+
=
+
Ejemplo. Suponga que dos drogas A y B, de las que se dice que reducen el tiempo de
respuesta de las ratas a determinado estmulo, se estn comparando en un experimento de
laboratorio. El experimentador sabe que en las respectivas poblaciones los tiempos de
respuesta al estmulo estn distribuidos normalmente. Se administra la droga A a 12 ratas y
la droga B a 13. Cuando se lleva a cabo el experimento, la reduccin promedio de tiempo
de respuesta al estmulo por parte de las ratas que estn recibiendo la droga A es 30,45
milisegundos con una desviacin de 5. Los datos correspondientes a la droga B son 24,9 y
6. Cul es la probabilidad de que la diferencia entre la reduccin promedio de tiempo de
respuesta al estmulo por parte de las ratas que estn recibiendo la droga A y la de las
ratas que estn recibiendo la droga B sea menor o igual a la observada en el experimente?
Tercer caso: varianzas poblacionales desconocidas,
diferentes y muestras pequeas.
( )
( )
2
2 2
1 2
1 2 1 2
1 2
2 2
2 2
2 2
1 2
1 2
1 2
1 2
1 2
1 1
s s
X X
n n
t v
s s
s s
n n
n n
n n

| |
+
|

\ .
= =
| | | |
+
| |
\ . \ .
+

Ejemplo. Retomemos el ejemplo anterior, pero suponiendo que las
poblaciones tienen distribucin normal, que los tamaos muestrales son
menores que 30 (12 y 13) y que las varianzas poblacionales son
diferentes.
Distribucin muestral de la varianza y
razn de varianzas
Distribucin muestral de la varianza muestral.
Si es la varianza de una muestra aleatoria de tamao n de una
poblacin, distribuida normalmente con media y varianza , entonces,
la distribucin muestral de es una distribucin con n 1 grados
de libertad.

2
s

2
o
( )
2
2
1 n s
o

2
_
( )
( )
2
2
2
1
; 1 .
n s
con n grados de libertad _
o

=
Ejemplo. Cuando un proceso de produccin est funcionando correctamente, la
resistencia en ohmios de los componentes que produce sigue una distribucin
normal con desviacin tpica de 3,6. Si toma una muestra aleatoria de cuatro
componentes, Cul es la probabilidad de que la varianza muestral sea mayor
que 27?
Distribucin muestral de la razn de dos varianzas.
Si y son las varianzas de varianzas de muestras aleatorias
independientes de tamao y tomadas de poblaciones normales con
varianzas y respectivamente, entonces la variable aleatoria.
2
1
s
2
2
s
2
1
o
2
2
o
1
n
2
n
2
1
2
1
1 1 2 2
2
2
2
2
; 1 1 .
s
F F de Fisher con v n y v n grados de libertad
s
o
o
| |
|
\ .
= = =
| |
|
\ .
Ejemplo. En una prueba sobre la efectividad de dos tipos de pldoras para dormir, A y
B, se utilizarn dos grupos independientes de personas con insomnio. A un grupo de
tamao 61se le administrar la pldora A y al otro grupo, de tamao 41, se le
administrar la B, registrndose el nmero de horas de sueo de cada individuo
participante en el estudio. Suponiendo que el nmero de horas de sueo de quienes
usan cada tipo de pldora se distribuye normalmente y que las varianzas son iguales,
calcule la probabilidad de que la razn de las varianzas muestrales de A y B sea
mayor que 1,64.