Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Licenciatura en Actuaria
Rafael Morales Ibarra
6. MUESTREO SISTEMÁTICO (MS)
Introducción
Muestreo Geográfico
Muestreo de control de calidad
Muestreo en auditorias o informatica donde se deben revisar largos listados
Muestreo en encuestas en grandes ciudades
Ventajas
Aplicación sencilla
Cuando no se dispone del marco muestral de la poblacion es una solución apropiada
La ordenacion de los elementos puede recoger cierto efecto de estratificación, cuando las
unidades estan correladas con un la variable de interes , en este caso puede mejorar al
m.a.s.
Proceso
1. Seleccionar la unidad ”i” de partida, con “i” entre las k primeras unidades, con
equiprobabilidad de 1/k.
2. Las restantes n-1 unidades de la muestreo vienen determinadas automaticamente pues son
aquellas que toman la posición i en cada una de las n particiones realizadas de la población.
1
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
Estimación en MS.
Suponga que k=N/n es un número entero. Por lo tanto su media muestral será:
Donde i es el punto de arranque de la MS escogido por m.a.s. de entre los números i=1,…, k y k
mediante la operación de k=N/n entero.
Corolario1 1. Estimacion del Total Poblacional y la Proporción. Un estimador insesgado del total
poblacional es N 𝑦̅^ .
Obs 1 2 3 4 5 6 7 8 9 10 11 12
y 2 3 2 5 6 8 5 4 6 5 2 1
2
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
6.2 ESTIMACIÓN DE LA MEDIA POBLACIONAL CUANDO k=N/n NO ES ENTERO
Supongamos que k=N/n NO es un número entero. Entonces hay que decidir si se toma k como
entero superior a N/n al inferior
Ejemplo (2): Se tiene una población formada por 5 observaciones numeradas del 1,2,3,4,5:
Obs 1 2 3 4 5
y 2 3 2 5 6
Suponga n=2, => k=5/2=2.5
Si se toma k=2, las 2 muestras sistemáticas posibles, escogidas a partir del inicio aleatorio entre las
dos primeras observaciones, son {1,3,5} y {2,4}. La segunda muestra tiene una observación menos.
Si se toma k=3, las 3 muestras posibles son {1,4}, {2,5} y {3}, se ve que la tercera muestra tiene una
observación menos. Así el tamaño de la muestra en este caso es una variable aleatoria.
Cuando k=2, las medias muestrales obtenidas de las dos posibles muestras son respectivamente
10/3 y 8/2.
Como cada muestra es equiprobable, la esperanza del estimador será ½ [10/3 + 8/2]= 3.666 ≠ 𝑢𝑦
Si se toma k=3 => {1,4}, {2,5} y {3} con valores respectivos {2,5}: {3,6}; {2}
Por lo tanto:
=> ∑ 𝑦𝑖 = 7; ∑ 𝑦𝑖 = 9 ∑ 𝑦𝑖 = 2
̅
La esperanza de la media muestral será 1/3 [7/2+ 9/2 + 2]= 3.333≠ 𝒚
Teorema: Estimador de la media: Sea yi el total calculado sobre la muestra sistemática “i”
considerando validas todas las muestras (con tamaños diferentes), y una vez escogido k para el
proceso de selección, que puede haber sido entero inferior o superior.
3
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
Solución:
Ejemplo (3) Suponga para el ejercicio anterior que k=2, entonces de la primera muestra se tiene
̅ ^ =(2/5)x10=4
yi=10 y por lo tanto 𝑦´
̅ ^ =(2/5)8 = 3.2. Como cada una de las 2
La segunda muestra da lugar a ∑ 𝑦𝑖 = 8 y por lo tanto a 𝑦´
muestras tiene probabilidad de ½, la esperanza del estimador 𝑦´̅ ^ será =1/2(4+3.2) =3.6 = 𝑦̅.
Nota: dado estos detalles, se busca evitar que N/n no sea entero, ya sea cambiando ligeramente
“n” o bien eliminando alguna observación poblacional al azar previamente.
1 2 3 4 5 6 7 8 9
1
2
3
4
5
6
Planteamiento incorrecto del MS en un área
Una de las SOLUCIONES a este problema es emplear el muestreo “alineado”. Bajo el supuesto de
que n puede descomponerse en el producto de dos enteros n1 y n2, de modo que n1xn2=n
Se asume que n1 > n2. Suponga también que r= números de columnas es múltiplo de n, y que s=
número de filas es múltiplo de n2, con r > s.
4
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
En concreto, el MS alineado consiste en:
Ejemplo (4). Suponga que un área como la representada en la figura anterior, se pretende realizar
un MS con n=6. Entonces se fijan n1=3 y n2=2
Los posibles puntos de arranque son todo el cuadro marcado con en la parte superior izquierda
del primer cuadriculado.
1 2 3 4 5 6 7 8 9 (1,1) 1 2 3 4 5 6 7 8 9
1 1
2 2
3 3
4 4
5 5
6 6
(1,3) 1 2 3 4 5 6 7 8 9 (3,3) 1 2 3 4 5 6 7 8 9
1 1
2 2
3 3
4 4
5 5
6 6
Posibles puntos de arranque y 3 muestras sistemáticas posibles de las 9
5
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
6.4 DESCOMPOSICIÓN DE LA VARIANZA EN MUESTREO SISTEMÁTICO
La varianza poblacional admite una descomposición de utilidad para comprender por qué
el MS puede mejorar al m.a.s.
Definición: supongamos yij es la unidad i dentro de la muestra sistemática “i”.
6
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
Teorema 7. Comparación del MS vs MAS
a). Si 𝑆𝑤2 > S2, => v(𝑦̅𝑠𝑖𝑠 ) < v(𝑦̅𝑚.𝑎.𝑠 )
b). Si 𝑆𝑤2 < S2, v(𝑦̅𝑠𝑖𝑠 ) > v(𝑦̅𝑚.𝑎.𝑠 )
Por lo tanto, las siguientes consideraciones son importantes a la hora de aplicar este tipo de
muestreo:
Cuando se ordenan los datos de manera aleatoria, el MS es igual de eficiente que el m.a.s.
ya que la varianza interna de cada MS será similar a la poblacional.
Si se ordena los datos en términos de la variable de interés o de otra variable altamente
correlacionada con ésta, el MS será más eficiente que el m.a.s. Ya que este orden hace que
la variación de cada MS sea mayor en general que la variabilidad poblacional S2.
La variabilidad interna de la MS será menor que la general (Sw<S2) y por lo tanto, el MS peor
que el m.a.s. en casos específicos, donde principalmente existe una relación cíclica en los
datos.
En casos cíclicos, el caso peor se da cuando la constante k es múltiplo de la longitud del ciclo
(en este caso Sw podría llegar a ser cero). Pero aun en estos casos cíclicos puede haber
valores de k que den lugar a Sw > S2, es decir, que el muestreo sistemático pueda ser más
preciso que el m.a.s. Si existe una sospecha de datos periódicos una manera de evitar
efectos perniciosos sobre el estimador es utilizar MS replicado.
Existen casos en los que el MS es peor que el m.a.s. tal es el caso cuando las unidades son los días
del año, horas o cualquier momento del tiempo.
{ 1,2,3,4,5,1,2,3,4,5,1,2,3,4,5,1,2,3,4,5,1,2,3,4,5 }
La cuasivarianza poblacional es S2=2.0833. Supongamos que queremos una muestra de tamaño n=5.
Dependiendo de la ordenación el MS puede ser mejor, igual o peor que el m.a.s.
7
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
S2w =2.10 S2
Se observa que el MS con ordenación ascendente mejora el m.a.s por ser S2w > S2, mientras
que la ordenación ciclica con n=5 hace que el MS sea realmente impreciso.
La ordenación aleatoria en este caso ha dado precisión similar para el MS y para el m.a.s.
Hay ordenaciones aleatorias posibles que dan una precisión menor para el MS respecto al
m.a.s. y otras que dan precision mayor.
En promedio ambos metodos, sistemáticos y m.a.s. son equivalentes si la ordenación es
aleatoria.
Con una sola MS no se puede obtener un estimador insesgado de la varianza del estimador.Una
posibilidad si el MS es apropiado (igual o mejor que el m.a.s) es utilizar el estimador de la varianza
usual de m.a.s.
como una aproximacion confiable, donde S2 es la cuasivarianza de la MS. (Tambien se puede utilizar
la formula habitual de m.a.s. para estimar la varianza del estimador del total y proporción
poblacionales)
̅ 𝑚 ^ =𝑁−𝑛 ∑𝑚
𝑦´ 𝑖=1 𝑦
̂𝑖 es el estimador insesgado de 𝑦̅.
𝑚
8
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
9
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
Ejemplo (6). Suponga los siguientes datos
Obs 1 2 3 4 5 6 7 8 9 10 11 12
Y 2 3 2 5 6 8 5 4 6 5 2 1
Se desea obtener una muestra sistemática de tamaño n=6. Para poder estimar la varianza
utilizaremos el método de las muestras interpenetrantes (replicadas). Tomando m=3 muestras
sistemáticas cada una de tamaño n´=n/m=6/2=3.
Suponga que después de seleccionar el arranque aleatorio de las dos muestras entre los k´=4
primeros números, son elegidos el 1 y el 3. Entonces las dos MS son {1,5,9} y {3,7,11} que
corresponden a los valores de y {2,6,6} y {2,5,2}.
Así ̅̅̅̅
𝑦1 ´^=1/3(2+6+6) =4.667,
̅̅̅̅
𝑦2 ´^=1/3 (2+5+2)= 3
1 1
Por lo tanto 𝑦̂𝑚 = 𝑚 ∑𝑚
𝑖=1 𝑦𝑖 = 2 (4.667 + 3) == 3.8333 y la estimacion de la varianza será
4−2 1
== 4 2(2−1)
= ((4.6672 + 32 ) − 2𝑥3.832 ) = 0.36
Como en este caso tenemos toda la población, podemos calcular la varianza real del estimador,
Como:
1
𝑦̅ = 12 (2 + 3 + 2 + 5 + 6 + ⋯ + 1) = 4.083 entonces se tiene que la varianza
4−2 1
= [(4.667 − 4.083)2 + (5.333 − 4.083)2 + (3.333 − 4.083)2 ] = 0.23384
4 2𝑥4
10
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
11
Notas para acompañar el curso de muestreo
Licenciatura en Actuaria
Rafael Morales Ibarra
12