Está en la página 1de 12

Notas para acompañar el curso de muestreo

Licenciatura en Actuaria
Rafael Morales Ibarra
6. MUESTREO SISTEMÁTICO (MS)
Introducción

En un Muestreo Sistematico (MS) la primera unidad es seleccionada aleatoriamente, mientras que


el resto son seleccionadas mediante un patrón definido. Es un muestreo práctico y eficiente en
muchas circunstancias entre las cuales se tienen ejercicios de:

 Muestreo Geográfico
 Muestreo de control de calidad
 Muestreo en auditorias o informatica donde se deben revisar largos listados
 Muestreo en encuestas en grandes ciudades

Ventajas

 Aplicación sencilla
 Cuando no se dispone del marco muestral de la poblacion es una solución apropiada
 La ordenacion de los elementos puede recoger cierto efecto de estratificación, cuando las
unidades estan correladas con un la variable de interes , en este caso puede mejorar al
m.a.s.

Proceso

 Calcular k=N/n => en realidad se esta obteniendo “k” segmentos (intervalos) de


tamaño “n” de los cuales se debe seleccionar aleatoriamente la unidad de arranque “i”
de entre los elementos que integran el primer bloque k1, con una probabilidad de ser
seleccionado = p(i)=1/k.

1. Seleccionar la unidad ”i” de partida, con “i” entre las k primeras unidades, con
equiprobabilidad de 1/k.
2. Las restantes n-1 unidades de la muestreo vienen determinadas automaticamente pues son
aquellas que toman la posición i en cada una de las n particiones realizadas de la población.

Es decir, las unidades seleccionadas son:

{i, i+k, i+2k, i+3k, …, i+n(-1)k}


Se puede apreciar que hay tanta muestras posibles, k, como unidades de partida existan. Es decir, a
cada unidad de partida i le corresponde una muestra {i,i+k, i+2k, i+3k, …, i+n(-1)k}.
𝑁
+++Recuerde que sin tener encuenta el orden de los elementos en m.a.s. se tienen ( )
𝑛
(combinación) muestras posibles. A pesar de que en en MS el número k=N/n es menor, el MS puede
proveer estimadores con una precisión similar al m.a.s.

1
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
Estimación en MS.
Suponga que k=N/n es un número entero. Por lo tanto su media muestral será:

Donde i es el punto de arranque de la MS escogido por m.a.s. de entre los números i=1,…, k y k
mediante la operación de k=N/n entero.

Teorema 1. Estimación de la media. La media muestral 𝑦̅^ es un estimador insesgado de la


media poblacional 𝑦̅

Teorema 2. Varianza del estimador. La varianza del estimador es:

Corolario1 1. Estimacion del Total Poblacional y la Proporción. Un estimador insesgado del total
poblacional es N 𝑦̅^ .

Mientras que un estimador insesgado de la proporción poblacional (P), es la proporción


muestral 𝑝̂ .

Ejemplo 1: Suponga que de los siguientes datos

a) Se desea obtener una muestra sistemática de tamaño n=4.

Obs 1 2 3 4 5 6 7 8 9 10 11 12
y 2 3 2 5 6 8 5 4 6 5 2 1

 Entonces k=N/n= 12/4 = 3


 Los puntos de arranque estarían variando entre u1 a u3.
 Muestras posibles: {1,4,7,10}, {2,5,8,11}, y {3,6,9,12}
 Valores de la muestra: {2,5,5,5},{3,6,4,2}, y {2,8,6,1}
 Medias muestrales respectiva: 4.25, 3.75, y 4.25

Nota: número de muestras empleando un muestreo con reemplazamiento es igual a:

(resolviendo la siguiente combinacio): (12+4-1)C4 =1,365 muestras posibles.

Mientras que en m.a.s. habría 12C4=495 muestra posibles.

b) Demuestre que el estimador de la media muestral es insesgado:


 Media poblacional: 1/12 [2+3+ …+1] = 4.0833 = Uy
 La esperanza matematica del estimador: 1/3[4.25 + 3.73 + 4.25] =4.0833

1 Razonamiento, juicio o hecho que es consecuencia lógica de lo demostrado o sucedido anteriormente .

2
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
6.2 ESTIMACIÓN DE LA MEDIA POBLACIONAL CUANDO k=N/n NO ES ENTERO

Supongamos que k=N/n NO es un número entero. Entonces hay que decidir si se toma k como
entero superior a N/n al inferior

Ejemplo (2): Se tiene una población formada por 5 observaciones numeradas del 1,2,3,4,5:

Obs 1 2 3 4 5
y 2 3 2 5 6
Suponga n=2, => k=5/2=2.5

Existen dos posibilidades, tomar k=2 o k=3.

Si se toma k=2, las 2 muestras sistemáticas posibles, escogidas a partir del inicio aleatorio entre las
dos primeras observaciones, son {1,3,5} y {2,4}. La segunda muestra tiene una observación menos.

Si se toma k=3, las 3 muestras posibles son {1,4}, {2,5} y {3}, se ve que la tercera muestra tiene una
observación menos. Así el tamaño de la muestra en este caso es una variable aleatoria.

Propiedad: La media muestral 𝑦̅^ No es un estimador insesgado de la media poblacional 𝑦̅


cuando N/n no es entero.

Recuerde que 𝑦̅=3.6 =18/5

Cuando k=2, las medias muestrales obtenidas de las dos posibles muestras son respectivamente

Las muestras serian: u1={1,3,5} y u2={2,4}

Con valores {2,2,6} y {3,5}

 10/3 y 8/2.

Como cada muestra es equiprobable, la esperanza del estimador será ½ [10/3 + 8/2]= 3.666 ≠ 𝑢𝑦

Si se toma k=3 => {1,4}, {2,5} y {3} con valores respectivos {2,5}: {3,6}; {2}

Por lo tanto:

=> ∑ 𝑦𝑖 = 7; ∑ 𝑦𝑖 = 9 ∑ 𝑦𝑖 = 2

̅
La esperanza de la media muestral será 1/3 [7/2+ 9/2 + 2]= 3.333≠ 𝒚

Teorema: Estimador de la media: Sea yi el total calculado sobre la muestra sistemática “i”
considerando validas todas las muestras (con tamaños diferentes), y una vez escogido k para el
proceso de selección, que puede haber sido entero inferior o superior.

3
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
Solución:

El estimador 𝑦̅^ = (k/N)yi es un estimador insesgado de 𝑦̅.

Ejemplo (3) Suponga para el ejercicio anterior que k=2, entonces de la primera muestra se tiene
̅ ^ =(2/5)x10=4
yi=10 y por lo tanto 𝑦´
̅ ^ =(2/5)8 = 3.2. Como cada una de las 2
La segunda muestra da lugar a ∑ 𝑦𝑖 = 8 y por lo tanto a 𝑦´
muestras tiene probabilidad de ½, la esperanza del estimador 𝑦´̅ ^ será =1/2(4+3.2) =3.6 = 𝑦̅.

Nota: dado estos detalles, se busca evitar que N/n no sea entero, ya sea cambiando ligeramente
“n” o bien eliminando alguna observación poblacional al azar previamente.

Además, cuando N es muy grande, el sesgo sería pequeño en caso de k no entero.

6.3 MUESTREO SISTEMÁTICO EN ÁREAS


Frecuentemente se usa el MS en un área geográfica, como área seleccionar varios árboles
frutales para evaluar su rendimiento. Para ello necesitamos utilizar un mapeo bidimensional
para evitar soluciones incorrectas.
Por lo tanto, si se dispone de un área cuadriculada, dividida en 9 columnas por 6 renglones,
y se numeran del 1 al 54, y se tiene una MS de n=6 se calcula k=N/n= 54/6=9, => puede
ocurrir que el punto de arranque sea u1 (el primer cuadrante), dando lugar a la configuración
muestral que se tiene en la siguiente figura:

1 2 3 4 5 6 7 8 9
1 
2 
3 
4 
5 
6 
Planteamiento incorrecto del MS en un área

Obviamente esta distribución es poco atractiva en cuanto a representatividad. Las 8 muestras


sistemáticas posibles son igualmente poco atractivas, al coincidir en la misma columna todos los
árboles.

Una de las SOLUCIONES a este problema es emplear el muestreo “alineado”. Bajo el supuesto de
que n puede descomponerse en el producto de dos enteros n1 y n2, de modo que n1xn2=n

Se asume que n1 > n2. Suponga también que r= números de columnas es múltiplo de n, y que s=
número de filas es múltiplo de n2, con r > s.

4
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
En concreto, el MS alineado consiste en:

1. Calcular k1=r/n1, k2=s/n2


2. Escoger el cuadro de arranque, cuyas coordenadas son (i,j), donde i esta escogido entre
1, …, k1 con equiprobabilidad y j esta escogido entre 1, …, k2 con equiprobabilidad.
3. La MS correspondiente al punto de arranque es
(i,j), (i+k1,j), (i+(n1-1)k1,j), (i,j+k2), … ,(i, j+(n2-1)k2)

Ejemplo (4). Suponga que un área como la representada en la figura anterior, se pretende realizar
un MS con n=6. Entonces se fijan n1=3 y n2=2

Se establece que n1=3, y n2=2.

Por lo que r/n1=9/3=3 y 6/2= s/n2=3 (i=1,2,3) (j=1,2,3)

Los posibles puntos de arranque son todo el cuadro marcado con  en la parte superior izquierda
del primer cuadriculado.

Como ejercicio complementario: Obtenga 3 muestras de las posibles 9 muestras sistemáticas


posibles que se pueden generar: (i,j)= (1,1)

1 2 3 4 5 6 7 8 9 (1,1) 1 2 3 4 5 6 7 8 9
1    1   
2    2
3    3
4 4   
5 5
6 6

(1,3) 1 2 3 4 5 6 7 8 9 (3,3) 1 2 3 4 5 6 7 8 9
1 1
2 2
3    3   
4 4
5 5
6    6   
Posibles puntos de arranque y 3 muestras sistemáticas posibles de las 9

Tarea No. 3: Generar las 6 muestras restantes

5
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
6.4 DESCOMPOSICIÓN DE LA VARIANZA EN MUESTREO SISTEMÁTICO
La varianza poblacional admite una descomposición de utilidad para comprender por qué
el MS puede mejorar al m.a.s.
Definición: supongamos yij es la unidad i dentro de la muestra sistemática “i”.

Llamaremos 𝜎𝑤2 a la variabilidad media interna de las MS. Es decir,

Donde 𝜎𝑏2 es la variabilidad entre MS y se define como:

Y que 𝜎𝑏2 coincide con la varianza del estimador de la media

Teorema 4: Descomposición de la varianza. La varianza de la población 2 se puede


descomponer en la suma de las varianzas dentro de muestras sistemáticas 𝜎𝑤2 y entre
muestras sistemáticas 𝜎𝑏2 .

Es decir, 2 = 𝜎𝑤2 + 𝜎𝑏2

COMPARACIÓN CON m.a.s.

Utilizando la descomposición de la varianza 2 = 𝜎𝑤2 + 𝜎𝑏2 la varianza del estimador de la


media en el método habitual en MS es v(𝑦̅𝑠𝑖𝑠 )=𝜎𝑤2 = 2 - 𝜎𝑏2 y
La varianza del estimador de la varianza de la media en m.a.s. es v(𝑦̅𝑚.𝑎.𝑠 )=(N-n/N)S2/n
Definiendo ahora la cuasi varianza interna de las muestras sistemáticas como:
𝑛
𝑆𝑤2 = 𝜎2
𝑛−1 𝑤
𝑁−1 𝑛−1
Se tiene que 𝑉(𝑦̅𝑠𝑖𝑠 ) = 𝑆2 − 𝑆𝑤2
𝑁 𝑛

6
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
Teorema 7. Comparación del MS vs MAS
a). Si 𝑆𝑤2 > S2, => v(𝑦̅𝑠𝑖𝑠 ) < v(𝑦̅𝑚.𝑎.𝑠 )
b). Si 𝑆𝑤2 < S2, v(𝑦̅𝑠𝑖𝑠 ) > v(𝑦̅𝑚.𝑎.𝑠 )

c). Si 𝑆𝑤2 = S2, v(𝑦̅𝑠𝑖𝑠 ) = v(𝑦̅𝑚.𝑎.𝑠 )


El Teorema 7, muestra que en el MS interesa que la variabilidad sea alta entre muestras.

Por lo tanto, las siguientes consideraciones son importantes a la hora de aplicar este tipo de
muestreo:

 Cuando se ordenan los datos de manera aleatoria, el MS es igual de eficiente que el m.a.s.
ya que la varianza interna de cada MS será similar a la poblacional.
 Si se ordena los datos en términos de la variable de interés o de otra variable altamente
correlacionada con ésta, el MS será más eficiente que el m.a.s. Ya que este orden hace que
la variación de cada MS sea mayor en general que la variabilidad poblacional S2.
 La variabilidad interna de la MS será menor que la general (Sw<S2) y por lo tanto, el MS peor
que el m.a.s. en casos específicos, donde principalmente existe una relación cíclica en los
datos.
 En casos cíclicos, el caso peor se da cuando la constante k es múltiplo de la longitud del ciclo
(en este caso Sw podría llegar a ser cero). Pero aun en estos casos cíclicos puede haber
valores de k que den lugar a Sw > S2, es decir, que el muestreo sistemático pueda ser más
preciso que el m.a.s. Si existe una sospecha de datos periódicos una manera de evitar
efectos perniciosos sobre el estimador es utilizar MS replicado.

Estas consideraciones llevan a reafirmar al MS como una opción práctica razonable.

Existen casos en los que el MS es peor que el m.a.s. tal es el caso cuando las unidades son los días
del año, horas o cualquier momento del tiempo.

Ejemplo (5). Suponga los siguientes datos:

{ 1,2,3,4,5,1,2,3,4,5,1,2,3,4,5,1,2,3,4,5,1,2,3,4,5 }
La cuasivarianza poblacional es S2=2.0833. Supongamos que queremos una muestra de tamaño n=5.
Dependiendo de la ordenación el MS puede ser mejor, igual o peor que el m.a.s.

 Ordenacion ciclica: {1,2,3,4,5,1,2,3,4,5,1,2,3,4,5,1,2,3,4,5 }


 Ordenacion aleatoria: {4,2,5,2,3,3,5,3,2,4,1,4,4,1,4,2,1,2,3,1,5,1,5,3,5 }
 Ordenacion ascendente: {1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,4,4,4,4,4,5,5,5,5,5 }

Como n=5 ; k=25/5=5 ; la MS y el valor de S2w para cada ordenacion son:

7
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra

 Ordenación ciclica: {1,1,1,1,1}; {2,2,2,2,2}; {3,3,3,3,3}; {4,4,4,4,4}; {5,5,5,5,5}

S2w = 0 < S2, pues la variabilidad interna de cada MS es 0.

 Ordenacion aleatoria: {4,3,1,2,5}, {2,5,4,1,1}, {5,3,4,2,5}, {2,2,1,3,3}, {3,4,4,1,5}

S2w =2.10  S2

 Ordenacion ascendentes: {1,2,3,4,5},{1,2,3,4,5},{1,2,3,4,5},{1,2,3,4,5},{1,2,3,4,5}

S2w = 2.5 > S2

 Se observa que el MS con ordenación ascendente mejora el m.a.s por ser S2w > S2, mientras
que la ordenación ciclica con n=5 hace que el MS sea realmente impreciso.
 La ordenación aleatoria en este caso ha dado precisión similar para el MS y para el m.a.s.
 Hay ordenaciones aleatorias posibles que dan una precisión menor para el MS respecto al
m.a.s. y otras que dan precision mayor.
 En promedio ambos metodos, sistemáticos y m.a.s. son equivalentes si la ordenación es
aleatoria.

6.5 ESTIMACIÓN DE LA VARIANZA: MUESTRAS INTERPENETRANTES

Con una sola MS no se puede obtener un estimador insesgado de la varianza del estimador.Una
posibilidad si el MS es apropiado (igual o mejor que el m.a.s) es utilizar el estimador de la varianza
usual de m.a.s.

como una aproximacion confiable, donde S2 es la cuasivarianza de la MS. (Tambien se puede utilizar
la formula habitual de m.a.s. para estimar la varianza del estimador del total y proporción
poblacionales)

 Otra manera de obtener un estimador insesgado es empleando el MS Replicado; que


consiste es lugar de tomar una MS de tamaño n, se toman “m” muestras sistematicas cada
una de tamaño n´=n/m, suponiendo este numero entero.
 Este metodo tambien se denomina muestras interpenetrantes o replicadas. Si 𝑦´ ̅ ^ es la
media muestral de la muestgra sistematica i, y definiendo k=N/n´entonces se dan los
siguientes resultados:

Teorema 5. Estimación de la media con muestras interpenetrantes

̅ 𝑚 ^ =𝑁−𝑛 ∑𝑚
𝑦´ 𝑖=1 𝑦
̂𝑖 es el estimador insesgado de 𝑦̅.
𝑚

Corolario 2. Varianza del estimador

8
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra

Teorema 6. Estimación de la varianza del estimador

Es un estimador insesgado de 𝑉(𝑦̂𝑚 )

9
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
Ejemplo (6). Suponga los siguientes datos

Obs 1 2 3 4 5 6 7 8 9 10 11 12
Y 2 3 2 5 6 8 5 4 6 5 2 1

Se desea obtener una muestra sistemática de tamaño n=6. Para poder estimar la varianza
utilizaremos el método de las muestras interpenetrantes (replicadas). Tomando m=3 muestras
sistemáticas cada una de tamaño n´=n/m=6/2=3.

Así k´ queda definido como k´=N/n´=12/3=4

Suponga que después de seleccionar el arranque aleatorio de las dos muestras entre los k´=4
primeros números, son elegidos el 1 y el 3. Entonces las dos MS son {1,5,9} y {3,7,11} que
corresponden a los valores de y {2,6,6} y {2,5,2}.

Así ̅̅̅̅
𝑦1 ´^=1/3(2+6+6) =4.667,
̅̅̅̅
𝑦2 ´^=1/3 (2+5+2)= 3

1 1
Por lo tanto 𝑦̂𝑚 = 𝑚 ∑𝑚
𝑖=1 𝑦𝑖 = 2 (4.667 + 3) == 3.8333 y la estimacion de la varianza será

4−2 1
== 4 2(2−1)
= ((4.6672 + 32 ) − 2𝑥3.832 ) = 0.36

Como en este caso tenemos toda la población, podemos calcular la varianza real del estimador,
Como:
1
𝑦̅ = 12 (2 + 3 + 2 + 5 + 6 + ⋯ + 1) = 4.083 entonces se tiene que la varianza

4−2 1
= [(4.667 − 4.083)2 + (5.333 − 4.083)2 + (3.333 − 4.083)2 ] = 0.23384
4 2𝑥4

10
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra

11
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra

12

También podría gustarte