Está en la página 1de 10

Teoría y Técnicas de Muestreo

Muestreo Aleatorio Simple (MRAS), con


remplazo
Mg. A. Gustavo Tolaba
agustavotolaba@gmail.com
Departamento de Matemática
Facultad de Ciencias Exactas
Universidad Nacional de Salta
Efecto del Diseño
Una medida que compara la eficiencia entre dos estrategias de muestreo es el efecto de
diseño. Esta herramienta práctica muestra la ganancia o pérdida, de precisión, al utilizar
una estrategia de muestreo más compleja que un diseño aleatorio simple sin reemplazo
junto con el estimador de Horvitz-Thompson y está definida de la siguiente manera:

Definicion: Siendo (𝑇 , 𝑝(·)) y (𝑇𝜋 , 𝑀𝐴𝑆) dos estrategias de muestreo utilizadas para la
estimación del parámetro 𝑇 , se define el efecto de diseño como:
𝑉𝑎𝑟𝑝 (𝑇)
𝐷𝑒𝑓𝑓 =
𝑉𝑎𝑟𝑀𝐴𝑆 (𝑇𝜋 )
Luego el efecto de diseño, restringido a la estimación de un total poblacional y al usar el
estimador de Horvitz-Thompson en ambas estrategias, toma la siguiente
forma
𝑉𝑎𝑟𝑝 (𝑡𝑦𝜋 )
𝐷𝑒𝑓𝑓 = 2
𝑁 𝑛 2
1− 𝑆 𝑦𝑈
𝑛 𝑁
Efecto del Diseño
𝑉𝑎𝑟𝑝 (𝑡𝑦𝜋 )
𝐷𝑒𝑓𝑓 = 2
𝑁 𝑛 2
1− 𝑆 𝑦𝑈
𝑛 𝑁
• Cuando el efecto de diseño es más grande que la unidad, la varianza de la estrategia
del numerador es más grande que la denominador, por tanto, se ha perdido precisión al
utilizar una estrategia de muestreo más compleja;
• si el cociente es menor que uno, se ha ganado precisión
• Cornfield (1951) sugirió evaluar la eficiencia de una estrategia de muestreo al hacer el
cociente entre la varianza de la misma y la del diseño aleatorio simple sin reemplazo con
el estimador de HT. Luego Kish (1965) lo llamo DEFF (efecto de diseño,por sus siglas en
inglés)
• en la mayoría de ocasiones, el cálculo de este cociente no es sencillo

Un estimador del efecto de diseño 𝐷𝑒𝑓𝑓 para el total poblacional 𝑡𝑦 es


𝑉𝑎𝑟𝑝 (𝑇)
𝐷𝑒𝑓𝑓 = 2
𝑁 𝑛 2
1− 𝑆 𝑦𝑠
𝑛 𝑁
Eficiencia del diseño Bernoulli vs al MAS
Dado que el tamaño de muestra en diseños diferentes al MAS sin reemplazo puede ser
variable, es necesario asegurarse que
𝑛 = 𝐸𝑀𝐴𝑆 (𝑛(𝑆)) = 𝐸𝑝 (𝑛(𝑆))
Por ejemplo, para comparar la eficiencia del estimador de HT en el diseño Bernoulli, es
necesario fijar el tamaño de muestra, dado que este diseño no es de tamaño fijo
𝑛 = 𝐸𝑀𝐴𝑆 𝑛 𝑆 = 𝐸𝐵𝑒𝑟 𝑛 𝑆 = 𝑁𝜋
Por ló que resulta que 𝜋 = 𝑛/𝑁.

𝑉𝑎𝑟𝐵𝑒𝑟 (𝑡𝑦𝜋 ) 1 1 1
𝐷𝑒𝑓𝑓 = =1− + ≅1+
𝑉𝑎𝑟𝑀𝐴𝑆 (𝑡𝑦𝜋 ) 𝑁 𝐶𝑉𝑦 2 𝐶𝑉𝑦 2

• Es más grande que la unidad, por tanto, se ha perdido precisión al utilizar una
estrategia de muestreo más compleja (diseño Bernoulli es 1,8 mas grande que MAS)
• No todos los parámetros tienen el mismo comportamiento, luego, los efectos de diseño
para estos no tendrán un mismo criterio de optimalidad.
• Es decir que el criterio de optimalidad con respecto a el total poblacional, no
necesariamente se cumplirá para la media poblacional.
Muestreo Aleatorio Simple (MRAS), con remplazo
Una muestra aleatoria simple con reemplazo, de tamaño 𝑚 de una población de 𝑁 elementos es la
extracción de 𝑚 muestras independientes de tamaño 1, en donde cada elemento se extrae de la
población con la misma probabilidad
1
𝑝𝑘 = , ∀𝑘 ∈ 𝑈
𝑁

Definición: Un diseño de muestreo aleatorio simple con reemplazo se define como:


𝑛𝑘 (𝑠)
𝑚! 1
𝑠𝑖 𝑛𝑘 ( 𝑠) = 𝑚
𝑝 𝑠 = 𝑛1 𝑠 !, … , 𝑛𝑁 𝑠 ! 𝑁
𝑈 𝑈
0 𝑐. 𝑜. 𝑐.
Donde 𝑛𝑘 (𝑠) es el número de veces que el elemento k-ésimo es seleccionado en la
muestra realizada 𝑠.
MRAS
𝑁+𝑚−1
Proposición: Para este diseño de muestreo, existen 𝑚
posibles muestras de
tamaño 𝑚.
𝑁+𝑚−1
𝐶𝑎𝑟𝑑 𝑄 =
𝑚

Proposición: Dado el soporte 𝑄 de todas las posibles muestras con reemplazo de tamaño
𝑚, se verifica que el diseño de muestreo aleatorio simple con reemplazo es tal que
𝑝 𝑠 =1
𝑠∈𝑄

Proposición: Para un diseño MAS con reemplazo, las probabilidades de inclusión de


primer y segundo orden están dadas por
𝑚
𝜋𝑘 = 1 − 1 − 𝑁1
𝜋𝑘𝑙 = 1 − 2 1 − 1 𝑁 𝑚 + 1 − 2 𝑁 𝑚
respectivamente.
Algoritmos de Selección

Tillé (2006) presenta dos algoritmos para seleccionar una MAS con reemplazo. El primero,
de manera general induce 𝑚 selecciones individuales y el segundo, es un método
secuencial que implementa la selección mediante la distribución binomial.

Método de 𝒎 selecciones:
1
1. Seleccionar un primer elemento con probabilidad de todo el conjunto de datos.
𝑁
1
2. Seleccionar un segundo elemento con probabilidad de todo el conjunto de datos.
𝑁
3. Continuar con el mismo procedimiento para el próximo elemento.
1
4. Seleccionar un m –ésimo elemento con probabilidad de todo el conjunto de datos.
𝑁
El método de selección se implementa en 𝑚 pasos, y aunque no es eficiente
computacionalmente, es muy conocido
Algoritmos de Selección

Método secuencial:
• Seleccionar 𝑛𝑘 veces el elemento k-ésimo de acuerdo a una distribución binomial.
𝑘−1
1
𝐵 𝑚− 𝑛𝑖 , , ∀𝑘 ∈ 𝑈
𝑁−𝑘+1
𝑖=1

Este procedimiento es mejor que el anterior porque permite seleccionar una muestra de
tamaño 𝑚 en una sola pasada por el conjunto de datos..
El estimador de Hansen-Hurwitz
Proposición: Para un diseño de MAS con remplazo, el estimador de HH del total
poblacional 𝑡𝑦 , su varianza y su varianza estimada:
𝑚
𝑁
𝑡𝑦 = 𝑦𝑖
𝑚
𝑖=1
𝑁−1 2
𝑉𝑎𝑟𝑀𝑅𝐴𝑆 (𝑡𝑦 ) = 𝑁 𝑆 𝑦𝑈
𝑚
𝑁2 2
𝑉𝑎𝑟𝑀𝑅𝐴𝑆 𝑡𝑦 = 𝑆 𝑦𝑆𝑟
𝑚
respectivamente, con
𝑚
2
1 2
𝑆 𝑦𝑆𝑟 = 𝑦𝑖 − 𝑦𝑈
𝑚−1
𝑖=1
Nótese que 𝑡𝑦 es insesgado para el total poblacional 𝑡𝑦 de la característica de interés 𝑦, y
que 𝑉𝑎𝑟𝑀𝑅𝐴𝑆 𝑡𝑦 es insesgado para 𝑉𝑎𝑟𝑀𝑅𝐴𝑆 (𝑡𝑦 ).
MAS sin remplazo vs Mas con remplazo
Eficiencia: Podemos comparar la eficiencia del MAS vs MRAS mediante efecto del
diseño, dada dos estrategias de muestreo utilizadas para la estimación del parámetro 𝑇 ,
se define el efecto de diseño como:
𝑉𝑎𝑟𝑀𝑅𝐴𝑆 (𝑡𝑦 )
𝐷𝑒𝑓𝑓 =
𝑉𝑎𝑟𝑀𝐴𝑆 (𝑡𝑦 )
Luego tendremos que
𝑁−1 2
𝑁 𝑆 𝑦𝑈 1 1 1
𝐷𝑒𝑓𝑓 = 2 𝑚 = 1− ≅
𝑁 𝑛 2 1−𝑓 𝑁 1−𝑓
1− 𝑆 𝑦𝑈
𝑛 𝑁

• En general se tiene que para tamaños de muestra muy pequeños, en comparación a 𝑁,


las dos estrategias arrojan resultados muy similares.
• A medida que el tamaño de muestra crece, en comparación a 𝑁, la medida 𝐷𝑒𝑓𝑓
aumenta significativamente; es decir, existe una pérdida muy grande de eficiencia.

También podría gustarte