Está en la página 1de 12

Captulo 1

Muestreo sistem
atico
El muestreo sistem
atico es un tipo de muestreo que es aplicable cuando los
elementos de la poblaci
on sobre la que se realiza el muestreo estan ordenados.
Este procedimiento de muestreo se basa en tomar muestras de una manera directa y ordenada a partir de una regla determinstica, tambien llamada sistematica.
Concretamente, a partir de una sola unidad que se selecciona en primer lugar, el
resto de unidades de la muestra vienen determinadas automaticamente al aplicarle a dicha unidad una regla seleccion sistematica. Bajo este procedimiento de
muestreo, por ejemplo, seleccionamos cada vigesimo nombre de una lista, cada
decimosegunda casa de un lado de una calle, cada quincuagesima pieza de una
lnea de montaje, etc..
En este captulo consideramos el dise
no muestral sistematico mas sencillo
llamado muestreo sistem
atico uniforme de paso k. La obtencion de una muestra
sistem
atica de tama
no n de una poblacion de N elementos se consigue siguiendo
el siguiente procedimiento.
1. Conseguir un listado ordenado de los N elementos de la poblacion.
2. Determinar el tama
no muestral n.
3. Definir el tama
no del salto sistematico k dado por k = N/n.
4. Elegir un n
umero aleatorio entre 1 y k (=arrranque aleatorio). Este
numero permite obtener la primera unidad muestral.
5. A partir de la posici
on , dando un salto de k unidades, obtendremos la
segunda unidad de la muestra u+k y de esta forma, saltando de k en k
unidades, el resto de la muestra estara formada por las unidades u+2k ,
u+3k , . . ., u+(n1)k .
Ejemplo 1 Consideramos una poblaci
on de 5000 agricultores pertenecientes a
una determinada zona y de la que se pretende extraer una muestra sistem
atica
de 10 agricultores. El procedimiento a seguir es el siguiente:
Definir el tama
no del salto sistem
atico k = 5000/10 = 500.
1

Selecciona un numero aleatorio r entre 1 y 500, (por ejemplo 96).


Seleccionar los restantes elementos de la muestra, 96, 96+500=596,
596+500=1096, 1596, 2096, 2596, 3096, 3596, 4096, 4596.
En realidad, bajo muestreo sistematico, clasificamos las unidades de la poblaci
on en n zonas o filas de tama
no k, las numeramos de izquierda a derecha
empezando por la primera unidad de la primera fila y pasando a a primera
unidad de la siguiente fila una que se haya agotado la fila anterior. Una vez
numeradas las N = nk unidades podemos expresarlas de la siguiente forma:
i
1
2
3
..
.

1
u1
uk+1
u2k+1
..
.

2
u2
uk+2
u2k+2
..
.

3
u3
uk+3
u2k+3

...
...
...
...
..
.

j
uj
uk+j
u2k+j

...
...
...

k
uk
uk+k
u2k+k
..
.

i
..
.

u(i1)k+1
..
.

u(i1)k+2
..
.

u(i1)k+3
..
.

...

u(i1)k+j

...
..
.

u(i1)k+k
..
.

u(n1)k+1

u(n1)k+2

u(n1)k+3

...

u(n1)k+j

...

u(n1)k+k

Con estas especificaciones, el espacio muestral esta formado por las siguientes
k muestras posibles:
(S1 )

= {u1 , u1+k , u1+2k , . . . , u1+(n1)k }

(S2 ) = {u2 , u2+k , u2+2k , . . . , u2+(n1)k }


..
.
(Sk )

= {uk , uk+k , uk+2k , . . . , uk+(n1)k }

Cada una de estas muestras tiene probabilidad igual a 1/k = n/N de ser seleccionada. Las probabilidades de inclusion de primer y segundo orden correspondiente a este dise
no muestral son
X
1
n
i =
p(s) = = , i = 1, 2, . . . , N,
k
N
sS;ui s

para la probabilidad de primer orden y



1/k si ui y uj estan en la misma muestra
ij = P [(ui , uj ) s]
0
en otro caso
Ejemplo 2 Dada la poblaci
on siguiente
ui
Xi

u1
1

u2
3

u3
5

u4
2

u5
4

u6
6

u7
2

u8
7

u9
3

se desea obtener una muestra sistem


atica de tama
no 3. Determinar el espacio
muestral.

1. Tenemos el listado ordenado de los 9 elementos.


2. Tama
no muestral n = 3.
3. El tama
no del salto sistem
atico es k = N/n = 9/3 = 3.
4. Elegir un numero aleatorio r entre 1 y 3.
Para r = 1, se tiene que la muestra viene dada por {u1 , u1+3 , u1+6 }.
Para r = 2, se tiene que la muestra viene dada por {u2 , u2+3 , u2+6 }.
Para r = 3, se tiene que la muestra viene dada por {u3 , u3+3 , u3+6 }.
A diferencia de los que puede ocurrir en el muestreo aleatorio, ninguna sucesi
on grande de elementos queda sin representacion. En consecuencia, si los
elementos considerados en el orden en que aparecen en la lista tienen a formar grupos o zonas de elementos parecidos respecto de la caracterstica que se
estudia, el muestreo sistem
atico puede ser mas representativo que el muestreo
aleatorio simple.
En el muestreo sistem
atico existe, pues un efecto que podemos llamar de
extension o estratificaci
on si cada grupo de k elementos consecutivos a partir del
primero se considera como un estrato. Debe tenerse en cuenta, sin embargo, que
en el muestreo estratificado aleatorio la seleccion se efect
ua independientemente
en cada estrato, mientras que en el muestreo sistematico todos los elementos
seleccionados ocupan el mismo lugar o numero de orden dentro de cada grupo
de k elementos.
El efecto anterior sera beneficioso para la representatividad de la muestra
cuando hay rachas o estratos sucesivos constituidos por elementos iguales o parecidos entre si. Por el contrario, si en la ordenacion de elementos poblacionales
existe cierta periodicidad y k es igual al periodo o m
ultiplo de este, la representatividad disminuye.
En el ejemplo anterior apreciamos que el tama
no del salto sistematico es un
numero entero, pero que ocurre si este tama
no k no es entero?
Una alternativa para solucionar este problema consiste en considerar el listado ordenado de todos los elementos de la poblacion como circular (es decir,
el elemento N + 1 coincide con el elemento 1). En este caso el procedimiento se
desarrolla de la siguiente manera.
Definir el tama
no del salto sistematico, k, como el entero mas cercano a
N/n.
Elegir un numero aleatorio, r, entre 1 y k.
Seleccionar los elementos de la lista: r, r + k, r + 2k, . . ., r + (n 1)k
teniendo en cuenta que la lista es circular.
Las ventajas e inconvenientes de este metodo de muestreo son, en resumen:
Ventajas

Extiende la muestra a toda la poblacion.


Recoge el posible efecto de estratificacion debido al orden en que
figuran las unidades de la poblacion.
No presenta problemas de calculo algebraico.
El error de muestreo suele ser inferior que en muestreo aleatorio simple o incluso que en estratificado.
Inconvenientes
La posibilidad de aumento de la varianza si existe periodicidad en la
poblaci
on.
El problema te
orico que se presenta en la estimacion de las varianzas
No hay independencia en la seleccion de unidades en las distintas
zonas, ya que las unidades extradas en cada zona dependen de la
seleccionada en la primera zona.
En general s
olo hay seleccion aleatoria para la primera unidad de la
muestra.

1.1.

Estimadores lineales insesgados

Las estimaciones del total, media, proporcion y total de clase poblacionales


son los siguientes:
Total
bstm = N x
b
=XX
j ,
b
siendo x
j la media de la muestra sistematica j resultante a partir del punto
de arranque j, mj .
Media
b
X
bj ,
=X
stm = x
bj la media de la muestra sistematica siendo x
b
siendo x
j la media de la
muestra sistem
atica j resultante a partir del punto de arranque j, mj .
Proporci
on
= P Pbstm = Pbj ,
siendo Pbj la proporci
on de la muestra sistematica j resultante a partir del
punto de arranque j, mj .
Total de clase
bstm = N Pbj ,
=AA
siendo Pbj la proporci
on de la muestra sistematica j resultante a partir del
punto de arranque j, mj .

Ejemplo 3 Dada la poblaci


on siguiente
ui
Xi

u1
1

u2
3

u3
5

u4
2

u5
4

u6
6

u7
2

u8
7

u9
3

se desea obtener una muestra sistem


atica de tama
no 3. Determinar la distribuci
on de probabilidad del estimador del total y el de la media.
Soluci
on. Las muestras posibles son (1, 2, 2), (3, 4, 7) y (5, 6, 3) siendo la
probabilidad de cada una de ellas k = 1/3. Se tiene que:
S(X)
(1,2,2)
(3,4,7)
(5,6,3)

P (X)
1/3
1/3
1/3

c
bstm = N X
j
X
15
42
42

b
c

X
stm = Xj
5/3
14/3
14/3

La distribuci
on de probabilidad en el muestreo de estos estimadores viene dado
por:
bstm = 15) = 1 , P (X
bstm = 42) = 2 .
P (X
3
3
2
1
b
b
P (X
P (X
stm = 14/3) = .
stm = 5/3) = ,
3
3
Adem
as dicho estimador es insesgado ya que:
bstm ) = 15 1 + 42 2 = 99 = 33 = X.
E(X
3
3
3
b
E(X
stm ) =

1.2.

5 1 14 2
33

+
=
= X.
33
3 3
9

Varianza de los estimadores

Bajo muestreo sistem


atico las varianzas de los estimadores de los parametros
vienen dadas por las siguientes expresiones:
Para la media,
k
1 X b
b
2,
V (X
)
=
(X j X)
stm
k j=1

donde el ndice j indica que se trata de la muestra sistematica asociada


b denota la media de la
al j-esimo punto de arranque y la expresion X
j
muestra sistem
atica asociada al j-esimo punto de arranque.
Para el total,
k
2 X
b X)
bstm ) = N
2,
V (X
(X
j
k j=1

Para la proporci
on,
k
X
b ) = 1
V (P
(Pbj P )2 ,
stm
k j=1

siendo Pbj la proporci


on de la muestra sistematica asociada al j-esimo
punto de arranque.
Para el total de clase
k
N2 X b
b

V (Astm ) =
(Pj P )2 .
k j=1

Ejemplo 4 Considerando el Ejemplo 3, calcular la varianza del estimador


b
X
on y la f
ormula dada en la teora.
stm considerando la definici
Para ello, notar que
33
5 28
b
+
=
,
E[X
stm ] =
9
9
9
y por lo tanto, aplicando la definicion de varianza de variable aleatoria es
2
b
b 2 ] (E[X
= E[X
stm ])
stm
 2
 2
 2
5
14
33
1
2
=
+

3
3
3
3
9
= 2.

b
V ar(X
stm )

Aplicando la f
ormula de la varianza para muestreo aleatorio simple, se tiene
que
b
V ar(X
stm )

=
=

1.3.

k
1 X b
2
(X j X)
k j=1

2

2 !
1
5 33
14 33

+2
3
3
9
3
9

2.

Descomposici
on de la varianza

Vamos a realizar la siguiente descomposicion de la suma de cuadrados para


el an
alisis de la varianza poblacional.
n X
k
X
2
(Xij X)

i=1 j=1

n X
k
X

b )2 +
(Xij X
j

i=1 j=1

k
n X
X
i=1 j=1

n X
k
X
b X)
2
(X
j
i=1 j=1

b )(X
b X).

(Xij X
j
j

El termino
n X
k
X

b )2 ,
(Xij X
j

i=1 j=1

representa la variaci
on dentro de las muestras. Por el contrario, el termino
n X
k
X

b X)
2,
(X
j

i=1 j=1

representa la variaci
on entre muestras. Si definimos la cuasivarianza entre las k
muestras posibles, o cuasivarianza intermuestral, como
n k
1 XX b
2,
(X j X)
k 1 i=1 j=1

2
Sbs
=

(1.1)

y la cuasivarianza dentro de las muestras o cuasivarianza intramuestral como


2
Sws
=

n k
1 XX
b )2 ,
(Xij X
j
N k i=1 j=1

(1.2)

se tiene en cuenta la siguiente division de la cuasivarianza poblacional,


2
2
(N 1)S 2 = (k 1)Sbs
+ (k(n 1))Sws
.

Seg
un esta nomenclatura, podemos expresar las varianzas de los estimadores de
la siguiente forma:
k

b
V (X
smt )

1 X b
2
(X j X)
k j=1

1 XX b
2
(X j X)
nk i=1 j=1

=
=

2
k 1 Sbs
n
k


2
2
2
1 Sbs
n  Sbs
n  Sbs
S2
1
= 1
= 1
= (1 f ) bs .
k
n
nk n
N
n
n

bsmt )
V (X

N2 2
S (k 1)
nk bs
S2
= N 2 (1 f ) bs .
n

2 XX
c
N 2 XX c
b X)
b X)
2=N
2
(X
(X
j
j
nk i=1 j=1
nk i=1 j=1

Se observa que las varianzas de los estimadores aumenta cuanto aumenta la cua2
sivarianza intermuestral Sbs
. Por lo tanto, para conseguir una mayor eficiencia
en el estimador, la variaci
on entre muestras debe ser lo mas peque
na posible, es
decir, que haya homogeneidad dentro de las muestras y que todas las posibles
muestras sean lo m
as parecidas entre s. Por otra parte,
b
V (X
smt )

=
=
=

bsmt )
V (X

2
2
k1 2
(N 1)S 2 (N k)Sws
Sbs
=
Sbs =
n
kn
N
N 1 2 N k 2
nk k 2
2
S
Sws =
Sws
N
N
n
n1 2
2
Sws

 n
n1 2
2
2
Sws .
N
n

(1 f )

Por lo tanto, la varianza de los estimadores sera menor cuanto mayor sea la
2
cuasivarianza intramuestral Sws
. Por lo tanto, conviene que la variacion dentro
de la muestras sea lo m
as grande posible, es decir, que haya heterogeneidad
entre las muestras.
En el caso del estimador del total de clase y de la proporcion, se obtienen
expresiones similares del tipo
2
Sbs
n

b
V (X
smt )

bsmt )
V (X

= N 2 (1 f )

V (Pb)
b
V (A)

(1 f )

2
Sbs
n

n1 2
= 2
Sws
 n

n1 2
2
2
Sws ,
= N
n

donde, en este caso,


2
Sws

n k
1 XX
(Aij Pj )2 ,
=
N k i=1 j=1

2
Sbs

n k
1 XX
=
(Pj P )2
k 1 i=1 j=1

Ejemplo 5 Consideramos el ejemplo 3 para el cual habamos obtenido la distribuci


on en el muestreo para el estimador de la media y del total y la varianza
del estimador.
2
2
bstm ) = 15 + 2 42 332 = 162.
V ar(X
3
3
Sin embargo, las varianzas tambien pueden calcularse a partir de las f
ormulas
deducidas para la descomposici
on de la varianza.
La cuasi-varianza entre las 3 muestras posibles, o cuasivarianza intermues-

tral, viene dado por


2
Sbs

=
=

n k
1 XX c
j X)
2
(X
k 1 i=1 j=1
" n 

2 #
X 5 33 2
14 33
1
+2

3 1 i=1 3
9
3
9


2
2
3 5 33
14 33
18
+3
=

.
2 3
9
3
9
2

An
alogamente, la cuasivarianza intramuestral, o cuasivarianza dentro de las
muestras, viene dada por
2
Sws

=
=

n k
1 XX
c
j )2 ,
(Xij X
N k i=1 j=1

1 
(1 5/3)2 + 2(2 5/3)2 + (3 14/3)2 + (4 14/3)2 +
93
 14
(7 14/3)2 + (5 14/3)2 + (6 14/3)2 + (3 14/3)2 =
,
6

y finalmente la cuasivarianza poblacional es igual a


S2 =

n k
1 XX
2 = 32 .
(Xij X)
N 1 i=1 j=1
8

Y comprobamos que se cumple la igualdad


2
2
(N 1)S 2 = (N k)Sws
+ (k 1)Sbs

Adem
as, utilizando la expresi
on para la varianza del estimador mediante la cuasivarianza intermuestral se tiene que
bstm ) = N 2 (1 3 ) 9 = 162,
V ar(X
9 3
que coincide con el valor obtenido aplicando la definici
on de varianza de variable
aleatoria.

1.3.1.

Comparaci
on con el muestreo aleatorio simple

La cuasivarianza intermuestral permite comparar el muestreo sistematico con


el muestreo aleatorio simple. As, debido a que tenemos las siguientes expresiones
2

b = (1 f ) S ,
V ar(X)
n

Sbs
b
V ar(X
,
smt ) = (1 f )
n

10

se tiene que el muestreo aleatorio simple tiene mas (menos) precision que el
2
2
muestreo sistem
atico cuando S 2 < Sbs
(S 2 > Sbs
) y coinciden en precision
2
2
cuando S = Sbs . An
alogamente, tenemos que
2
2
bsmt ) = N 2 (1 f ) Sbs .
b = N 2 (1 f ) S , V ar(X
V ar(X)
n
n
Ejemplo 6 Comparar el muestreo sistem
atico dado en el Ejemplo 3 con el
realizado mediante muestreo aleatorio simple.
2
En este caso particular, se tiene que la cuasivarianza intermuestral Sbs
viene
2
2
2
2
dada por Sbs = 9 y la cuasi-varianza poblacional es de S = 4. Como S < Sbs
,
entonces el muestreo aleatorio simple en este caso particular tiene m
as precisi
on
que el realizado mediante muestreo sistem
atico.

Pasamos ahora al problema de estimacion de las varianzas

1.4.

Estimaci
on de la varianza de los estimadores

La estimaci
on de la varianza de los estimadores es uno de los problemas que
plantea el uso de este metodo de muestreo ya que no hay un metodo directo
para obtener dichas estimaciones a partir de una muestra sistematica. En este
punto, presentamos tres metodos para aproximar la varianza de los estimadores
1. Si la ordenaci
on de los elementos en la poblacion puede considerarse
aleatoria, los resultados que proporcionar una muestra sistematica y una
muestra aleatoria simple son similares. Por tanto, podemos estimar la
varianza de los estimadores de los parametros usuales como si se tratase
de un muestreo aleatorio simple. En el caso del estimador de la media
2

Sj
b
,
Vb (X
stm ) = (1 f )
n
donde Sbj2 es la cuasi-varianza de la muestra tomada, mj . Para el resto de
los estimadores se tiene que
Sbj2
n
b
b
Pj Qj
(1 f )
n1
bj
Pbj Q
N 2 (1 f )
.
n1

bstm )
Vb (X

= N 2 (1 f )

Vb (Pbstm )

bstm )
Vb (A

Para detectar este aleatoriedad en la poblacion examinamos la cuasiva2


rianza intermuestral Sbs
y si esta cercana a la cuasivarianza poblacional
podemos suponer que la poblacion es aleatoria.

11

2. Metodo de las diferencias sucesivas.


Se basa en utilizar la suma de los cuadrados de las diferencias entre cada
dos elementos consecutivos de la muestra, y ajustando este resultado convenientemente por una costante, aproximar la estimacion de la varianza
del estimador de la media mediante la expresion
n1
(1 f ) X
b
Vb (X
(Xi Xi+1 )2
sist ) =
2n(n 1) i=1
n1
N (N n) X
b
b
(Xi Xi+1 )2
V (Xsist ) =
2n(n 1) i=1

3. Metodo de las muestras interpenetrantes


En ocasiones, no podemos estimar la varianza del estimador en funcion
de la informaci
on contenida en una sola muestra sistematica. Se llaman
muestras interpenetrantes al conjunto formado por dos o mas muestras
elegidas bajo el mismo esquema de muestreo de forma que cada una de
ellas proporciona un estimador del parametro poblacional de interes.
Sea b1 , b2 , . . . , bk , estimadores insesgados del parametro poblacional y
b basados en k muestras independientes. Su mecon varianza igual a V ()
dia
k
1 Xb
i ,
bc =
k i=1
es tambien un estimador insesgado de ya que
E[bc ] =

k
1X b
k
E[i ] =
= ,
k i=1
k

y su varianza puede calcularse facilmente como


V (bc ) =

k
b
V ()
1 X b
V (i ) =
.
2
k i=1
k

Adem
as, un estimador insesgado de esta varianza viene dada por
Vb (bc ) =

t
X
1
(
b2 tbc2 ).
t(t 1) i=1 i

Para aplicar este metodo al muestreo sistematico, en vez de tomar una


muestra sistem
atica de tama
no n a partir de un u
nico arranque aleatorio,
se toman t muestras sistematicas de tama
nos n/t a partir de t arranques
aleatorios.
Ejemplo 7 Para t = 2, es decir, considerando dos muestras sistem
aticas
con distintos arranques, obtener las expresiones de los estimadores de los
par
ametros usuales y las estimaciones de sus varianzas considerando el
metodo de las muestras interpenetrantes.

12

Para el estimador de la media


b
b2
1 + x
bc = x
X
,
2

b
b
1 x
2 )2
c
c ) = (x
Vb (X
.
4

Para el estimador del total


b1 + x
b2
bc = N x
X
,
2

2 b
b
1 x
2 )2
cc = N (x
Vb X
.
4

Para el estimador de la proporci


on y el total de clase basta con sustituir
las medias muestrales por las proporciones muestrales en las expresiones
anteriores de la media y el total, respectivamente.
Ejemplo 8 En un proceso de control de calidad se trata de analizar la producci
on de piezas en serie de 13 m
aquinas. Para ello se controlaron las piezas
producidas por las 13 m
aquinas en el primer momento de su funcionamiento.
La distribuci
on de piezas producidas por cada m
aquina en el primer minuto de
funcionamiento es:
M
aquina
N
umero piezas

1
5

2
5

3
4

4
2

5
5

6
4

7
5

8
4

9
3

10
4

11
4

12
3

13
2

Para estimar el n
umero de piezas defectuosas en el proceso de producci
on
se realiza un muestreo sistem
atico 1 en 5, es decir, se selecciona una de cada
cinco piezas empezando por la primera pieza de la primera m
aquina hasta que
se agoten sus piezas para pasar a continuaci
on a la primera pieza de la segunda
m
aquina hasta que se agoten sus piezas y as sucesivamente. Suponiendo que
la primera pieza producida por cada m
aquina es defectuosa y las dem
as son
correctas, se pide
Calcular la varianza del estimador de la proporci
on de piezas defectuosas
producidas por las m
aquinas. Existir
a ganancia en precisi
on respecto de
un muestreo aleatorio simple con fracci
on de muestreo del 20 %?
Calcular el coeficiente de correlaci
on intermuestral.
Suponiendo que la distribuci
on de la poblaci
on es aleatoria, estimar la
varianza para cada muestra sistem
atica. Con que muestra sistem
atica
nos quedaremos que mejor represente a la producci
on?

También podría gustarte