Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Muestreo Sistematico
Muestreo Sistematico
Muestreo sistem
atico
El muestreo sistem
atico es un tipo de muestreo que es aplicable cuando los
elementos de la poblaci
on sobre la que se realiza el muestreo estan ordenados.
Este procedimiento de muestreo se basa en tomar muestras de una manera directa y ordenada a partir de una regla determinstica, tambien llamada sistematica.
Concretamente, a partir de una sola unidad que se selecciona en primer lugar, el
resto de unidades de la muestra vienen determinadas automaticamente al aplicarle a dicha unidad una regla seleccion sistematica. Bajo este procedimiento de
muestreo, por ejemplo, seleccionamos cada vigesimo nombre de una lista, cada
decimosegunda casa de un lado de una calle, cada quincuagesima pieza de una
lnea de montaje, etc..
En este captulo consideramos el dise
no muestral sistematico mas sencillo
llamado muestreo sistem
atico uniforme de paso k. La obtencion de una muestra
sistem
atica de tama
no n de una poblacion de N elementos se consigue siguiendo
el siguiente procedimiento.
1. Conseguir un listado ordenado de los N elementos de la poblacion.
2. Determinar el tama
no muestral n.
3. Definir el tama
no del salto sistematico k dado por k = N/n.
4. Elegir un n
umero aleatorio entre 1 y k (=arrranque aleatorio). Este
numero permite obtener la primera unidad muestral.
5. A partir de la posici
on , dando un salto de k unidades, obtendremos la
segunda unidad de la muestra u+k y de esta forma, saltando de k en k
unidades, el resto de la muestra estara formada por las unidades u+2k ,
u+3k , . . ., u+(n1)k .
Ejemplo 1 Consideramos una poblaci
on de 5000 agricultores pertenecientes a
una determinada zona y de la que se pretende extraer una muestra sistem
atica
de 10 agricultores. El procedimiento a seguir es el siguiente:
Definir el tama
no del salto sistem
atico k = 5000/10 = 500.
1
1
u1
uk+1
u2k+1
..
.
2
u2
uk+2
u2k+2
..
.
3
u3
uk+3
u2k+3
...
...
...
...
..
.
j
uj
uk+j
u2k+j
...
...
...
k
uk
uk+k
u2k+k
..
.
i
..
.
u(i1)k+1
..
.
u(i1)k+2
..
.
u(i1)k+3
..
.
...
u(i1)k+j
...
..
.
u(i1)k+k
..
.
u(n1)k+1
u(n1)k+2
u(n1)k+3
...
u(n1)k+j
...
u(n1)k+k
Con estas especificaciones, el espacio muestral esta formado por las siguientes
k muestras posibles:
(S1 )
Cada una de estas muestras tiene probabilidad igual a 1/k = n/N de ser seleccionada. Las probabilidades de inclusion de primer y segundo orden correspondiente a este dise
no muestral son
X
1
n
i =
p(s) = = , i = 1, 2, . . . , N,
k
N
sS;ui s
u1
1
u2
3
u3
5
u4
2
u5
4
u6
6
u7
2
u8
7
u9
3
1.1.
u1
1
u2
3
u3
5
u4
2
u5
4
u6
6
u7
2
u8
7
u9
3
P (X)
1/3
1/3
1/3
c
bstm = N X
j
X
15
42
42
b
c
X
stm = Xj
5/3
14/3
14/3
La distribuci
on de probabilidad en el muestreo de estos estimadores viene dado
por:
bstm = 15) = 1 , P (X
bstm = 42) = 2 .
P (X
3
3
2
1
b
b
P (X
P (X
stm = 14/3) = .
stm = 5/3) = ,
3
3
Adem
as dicho estimador es insesgado ya que:
bstm ) = 15 1 + 42 2 = 99 = 33 = X.
E(X
3
3
3
b
E(X
stm ) =
1.2.
5 1 14 2
33
+
=
= X.
33
3 3
9
Para la proporci
on,
k
X
b ) = 1
V (P
(Pbj P )2 ,
stm
k j=1
V (Astm ) =
(Pj P )2 .
k j=1
3
3
3
3
9
= 2.
b
V ar(X
stm )
Aplicando la f
ormula de la varianza para muestreo aleatorio simple, se tiene
que
b
V ar(X
stm )
=
=
1.3.
k
1 X b
2
(X j X)
k j=1
2
2 !
1
5 33
14 33
+2
3
3
9
3
9
2.
Descomposici
on de la varianza
i=1 j=1
n X
k
X
b )2 +
(Xij X
j
i=1 j=1
k
n X
X
i=1 j=1
n X
k
X
b X)
2
(X
j
i=1 j=1
b )(X
b X).
(Xij X
j
j
El termino
n X
k
X
b )2 ,
(Xij X
j
i=1 j=1
representa la variaci
on dentro de las muestras. Por el contrario, el termino
n X
k
X
b X)
2,
(X
j
i=1 j=1
representa la variaci
on entre muestras. Si definimos la cuasivarianza entre las k
muestras posibles, o cuasivarianza intermuestral, como
n k
1 XX b
2,
(X j X)
k 1 i=1 j=1
2
Sbs
=
(1.1)
n k
1 XX
b )2 ,
(Xij X
j
N k i=1 j=1
(1.2)
Seg
un esta nomenclatura, podemos expresar las varianzas de los estimadores de
la siguiente forma:
k
b
V (X
smt )
1 X b
2
(X j X)
k j=1
1 XX b
2
(X j X)
nk i=1 j=1
=
=
2
k 1 Sbs
n
k
2
2
2
1 Sbs
n Sbs
n Sbs
S2
1
= 1
= 1
= (1 f ) bs .
k
n
nk n
N
n
n
bsmt )
V (X
N2 2
S (k 1)
nk bs
S2
= N 2 (1 f ) bs .
n
2 XX
c
N 2 XX c
b X)
b X)
2=N
2
(X
(X
j
j
nk i=1 j=1
nk i=1 j=1
Se observa que las varianzas de los estimadores aumenta cuanto aumenta la cua2
sivarianza intermuestral Sbs
. Por lo tanto, para conseguir una mayor eficiencia
en el estimador, la variaci
on entre muestras debe ser lo mas peque
na posible, es
decir, que haya homogeneidad dentro de las muestras y que todas las posibles
muestras sean lo m
as parecidas entre s. Por otra parte,
b
V (X
smt )
=
=
=
bsmt )
V (X
2
2
k1 2
(N 1)S 2 (N k)Sws
Sbs
=
Sbs =
n
kn
N
N 1 2 N k 2
nk k 2
2
S
Sws =
Sws
N
N
n
n1 2
2
Sws
n
n1 2
2
2
Sws .
N
n
(1 f )
Por lo tanto, la varianza de los estimadores sera menor cuanto mayor sea la
2
cuasivarianza intramuestral Sws
. Por lo tanto, conviene que la variacion dentro
de la muestras sea lo m
as grande posible, es decir, que haya heterogeneidad
entre las muestras.
En el caso del estimador del total de clase y de la proporcion, se obtienen
expresiones similares del tipo
2
Sbs
n
b
V (X
smt )
bsmt )
V (X
= N 2 (1 f )
V (Pb)
b
V (A)
(1 f )
2
Sbs
n
n1 2
= 2
Sws
n
n1 2
2
2
Sws ,
= N
n
n k
1 XX
(Aij Pj )2 ,
=
N k i=1 j=1
2
Sbs
n k
1 XX
=
(Pj P )2
k 1 i=1 j=1
=
=
n k
1 XX c
j X)
2
(X
k 1 i=1 j=1
" n
2 #
X 5 33 2
14 33
1
+2
3 1 i=1 3
9
3
9
2
2
3 5 33
14 33
18
+3
=
.
2 3
9
3
9
2
An
alogamente, la cuasivarianza intramuestral, o cuasivarianza dentro de las
muestras, viene dada por
2
Sws
=
=
n k
1 XX
c
j )2 ,
(Xij X
N k i=1 j=1
1
(1 5/3)2 + 2(2 5/3)2 + (3 14/3)2 + (4 14/3)2 +
93
14
(7 14/3)2 + (5 14/3)2 + (6 14/3)2 + (3 14/3)2 =
,
6
n k
1 XX
2 = 32 .
(Xij X)
N 1 i=1 j=1
8
Adem
as, utilizando la expresi
on para la varianza del estimador mediante la cuasivarianza intermuestral se tiene que
bstm ) = N 2 (1 3 ) 9 = 162,
V ar(X
9 3
que coincide con el valor obtenido aplicando la definici
on de varianza de variable
aleatoria.
1.3.1.
Comparaci
on con el muestreo aleatorio simple
b = (1 f ) S ,
V ar(X)
n
Sbs
b
V ar(X
,
smt ) = (1 f )
n
10
se tiene que el muestreo aleatorio simple tiene mas (menos) precision que el
2
2
muestreo sistem
atico cuando S 2 < Sbs
(S 2 > Sbs
) y coinciden en precision
2
2
cuando S = Sbs . An
alogamente, tenemos que
2
2
bsmt ) = N 2 (1 f ) Sbs .
b = N 2 (1 f ) S , V ar(X
V ar(X)
n
n
Ejemplo 6 Comparar el muestreo sistem
atico dado en el Ejemplo 3 con el
realizado mediante muestreo aleatorio simple.
2
En este caso particular, se tiene que la cuasivarianza intermuestral Sbs
viene
2
2
2
2
dada por Sbs = 9 y la cuasi-varianza poblacional es de S = 4. Como S < Sbs
,
entonces el muestreo aleatorio simple en este caso particular tiene m
as precisi
on
que el realizado mediante muestreo sistem
atico.
1.4.
Estimaci
on de la varianza de los estimadores
La estimaci
on de la varianza de los estimadores es uno de los problemas que
plantea el uso de este metodo de muestreo ya que no hay un metodo directo
para obtener dichas estimaciones a partir de una muestra sistematica. En este
punto, presentamos tres metodos para aproximar la varianza de los estimadores
1. Si la ordenaci
on de los elementos en la poblacion puede considerarse
aleatoria, los resultados que proporcionar una muestra sistematica y una
muestra aleatoria simple son similares. Por tanto, podemos estimar la
varianza de los estimadores de los parametros usuales como si se tratase
de un muestreo aleatorio simple. En el caso del estimador de la media
2
Sj
b
,
Vb (X
stm ) = (1 f )
n
donde Sbj2 es la cuasi-varianza de la muestra tomada, mj . Para el resto de
los estimadores se tiene que
Sbj2
n
b
b
Pj Qj
(1 f )
n1
bj
Pbj Q
N 2 (1 f )
.
n1
bstm )
Vb (X
= N 2 (1 f )
Vb (Pbstm )
bstm )
Vb (A
11
k
1X b
k
E[i ] =
= ,
k i=1
k
k
b
V ()
1 X b
V (i ) =
.
2
k i=1
k
Adem
as, un estimador insesgado de esta varianza viene dada por
Vb (bc ) =
t
X
1
(
b2 tbc2 ).
t(t 1) i=1 i
12
b
b
1 x
2 )2
c
c ) = (x
Vb (X
.
4
2 b
b
1 x
2 )2
cc = N (x
Vb X
.
4
1
5
2
5
3
4
4
2
5
5
6
4
7
5
8
4
9
3
10
4
11
4
12
3
13
2
Para estimar el n
umero de piezas defectuosas en el proceso de producci
on
se realiza un muestreo sistem
atico 1 en 5, es decir, se selecciona una de cada
cinco piezas empezando por la primera pieza de la primera m
aquina hasta que
se agoten sus piezas para pasar a continuaci
on a la primera pieza de la segunda
m
aquina hasta que se agoten sus piezas y as sucesivamente. Suponiendo que
la primera pieza producida por cada m
aquina es defectuosa y las dem
as son
correctas, se pide
Calcular la varianza del estimador de la proporci
on de piezas defectuosas
producidas por las m
aquinas. Existir
a ganancia en precisi
on respecto de
un muestreo aleatorio simple con fracci
on de muestreo del 20 %?
Calcular el coeficiente de correlaci
on intermuestral.
Suponiendo que la distribuci
on de la poblaci
on es aleatoria, estimar la
varianza para cada muestra sistem
atica. Con que muestra sistem
atica
nos quedaremos que mejor represente a la producci
on?