Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Definicion: Siendo (𝑇 , 𝑝(·)) y (𝑇𝜋 , 𝑀𝐴𝑆) dos estrategias de muestreo utilizadas para la
estimación del parámetro 𝑇 , se define el efecto de diseño como:
𝑉𝑎𝑟𝑝 (𝑇)
𝐷𝑒𝑓𝑓 =
𝑉𝑎𝑟𝑀𝐴𝑆 (𝑇𝜋 )
Luego el efecto de diseño, restringido a la estimación de un total poblacional y al usar el
estimador de Horvitz-Thompson en ambas estrategias, toma la siguiente
forma
𝑉𝑎𝑟𝑝 (𝑡𝑦𝜋 )
𝐷𝑒𝑓𝑓 = 2
𝑁 𝑛 2
1− 𝑆 𝑦𝑈
𝑛 𝑁
Efecto del Diseño
𝑉𝑎𝑟𝑝 (𝑡𝑦𝜋 )
𝐷𝑒𝑓𝑓 = 2
𝑁 𝑛 2
1− 𝑆 𝑦𝑈
𝑛 𝑁
• Cuando el efecto de diseño es más grande que la unidad, la varianza de la estrategia
del numerador es más grande que la denominador, por tanto, se ha perdido precisión al
utilizar una estrategia de muestreo más compleja;
• si el cociente es menor que uno, se ha ganado precisión
• Cornfield (1951) sugirió evaluar la eficiencia de una estrategia de muestreo al hacer el
cociente entre la varianza de la misma y la del diseño aleatorio simple sin reemplazo con
el estimador de HT. Luego Kish (1965) lo llamo DEFF (efecto de diseño,por sus siglas en
inglés)
• en la mayoría de ocasiones, el cálculo de este cociente no es sencillo
𝑉𝑎𝑟𝐵𝑒𝑟 (𝑡𝑦𝜋 ) 1 1 1
𝐷𝑒𝑓𝑓 = =1− + ≅1+
𝑉𝑎𝑟𝑀𝐴𝑆 (𝑡𝑦𝜋 ) 𝑁 𝐶𝑉𝑦 2 𝐶𝑉𝑦 2
• Es más grande que la unidad, por tanto, se ha perdido precisión al utilizar una
estrategia de muestreo más compleja (diseño Bernoulli es 1,8 mas grande que MAS)
• No todos los parámetros tienen el mismo comportamiento, luego, los efectos de diseño
para estos no tendrán un mismo criterio de optimalidad.
• Es decir que el criterio de optimalidad con respecto a el total poblacional, no
necesariamente se cumplirá para la media poblacional.
Muestreo Aleatorio Simple (MRAS), con remplazo
Una muestra aleatoria simple con reemplazo, de tamaño 𝑚 de una población de 𝑁 elementos es la
extracción de 𝑚 muestras independientes de tamaño 1, en donde cada elemento se extrae de la
población con la misma probabilidad
1
𝑝𝑘 = , ∀𝑘 ∈ 𝑈
𝑁
Proposición: Dado el soporte 𝑄 de todas las posibles muestras con reemplazo de tamaño
𝑚, se verifica que el diseño de muestreo aleatorio simple con reemplazo es tal que
𝑝 𝑠 =1
𝑠∈𝑄
Tillé (2006) presenta dos algoritmos para seleccionar una MAS con reemplazo. El primero,
de manera general induce 𝑚 selecciones individuales y el segundo, es un método
secuencial que implementa la selección mediante la distribución binomial.
Método de 𝒎 selecciones:
1
1. Seleccionar un primer elemento con probabilidad de todo el conjunto de datos.
𝑁
1
2. Seleccionar un segundo elemento con probabilidad de todo el conjunto de datos.
𝑁
3. Continuar con el mismo procedimiento para el próximo elemento.
1
4. Seleccionar un m –ésimo elemento con probabilidad de todo el conjunto de datos.
𝑁
El método de selección se implementa en 𝑚 pasos, y aunque no es eficiente
computacionalmente, es muy conocido
Algoritmos de Selección
Método secuencial:
• Seleccionar 𝑛𝑘 veces el elemento k-ésimo de acuerdo a una distribución binomial.
𝑘−1
1
𝐵 𝑚− 𝑛𝑖 , , ∀𝑘 ∈ 𝑈
𝑁−𝑘+1
𝑖=1
Este procedimiento es mejor que el anterior porque permite seleccionar una muestra de
tamaño 𝑚 en una sola pasada por el conjunto de datos..
El estimador de Hansen-Hurwitz
Proposición: Para un diseño de MAS con remplazo, el estimador de HH del total
poblacional 𝑡𝑦 , su varianza y su varianza estimada:
𝑚
𝑁
𝑡𝑦 = 𝑦𝑖
𝑚
𝑖=1
𝑁−1 2
𝑉𝑎𝑟𝑀𝑅𝐴𝑆 (𝑡𝑦 ) = 𝑁 𝑆 𝑦𝑈
𝑚
𝑁2 2
𝑉𝑎𝑟𝑀𝑅𝐴𝑆 𝑡𝑦 = 𝑆 𝑦𝑆𝑟
𝑚
respectivamente, con
𝑚
2
1 2
𝑆 𝑦𝑆𝑟 = 𝑦𝑖 − 𝑦𝑈
𝑚−1
𝑖=1
Nótese que 𝑡𝑦 es insesgado para el total poblacional 𝑡𝑦 de la característica de interés 𝑦, y
que 𝑉𝑎𝑟𝑀𝑅𝐴𝑆 𝑡𝑦 es insesgado para 𝑉𝑎𝑟𝑀𝑅𝐴𝑆 (𝑡𝑦 ).
MAS sin remplazo vs Mas con remplazo
Eficiencia: Podemos comparar la eficiencia del MAS vs MRAS mediante efecto del
diseño, dada dos estrategias de muestreo utilizadas para la estimación del parámetro 𝑇 ,
se define el efecto de diseño como:
𝑉𝑎𝑟𝑀𝑅𝐴𝑆 (𝑡𝑦 )
𝐷𝑒𝑓𝑓 =
𝑉𝑎𝑟𝑀𝐴𝑆 (𝑡𝑦 )
Luego tendremos que
𝑁−1 2
𝑁 𝑆 𝑦𝑈 1 1 1
𝐷𝑒𝑓𝑓 = 2 𝑚 = 1− ≅
𝑁 𝑛 2 1−𝑓 𝑁 1−𝑓
1− 𝑆 𝑦𝑈
𝑛 𝑁