Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Muestreo de Conglomerados
𝑈𝑖 = 𝑈
𝑖=1
𝑈𝑖 ∩ 𝑈𝑗 = ∅, ∀𝑖 ≠ 𝑗
𝑁𝑖 = 𝑁
𝑖=1
donde 𝑁 es el tamaño de la población 𝑈. Con la población dividida en 𝑁𝑖 conglomerados,
los parámetros poblacionales de interés pueden escribirse como:
Muestreo de Conglomerados
El total poblacional
𝑁𝑖 𝑁𝑖
𝑡𝑦 = 𝑦𝑘 = 𝑦𝑘 = 𝑡𝑦𝑖
𝑘∈𝑈 𝑖=1 𝑘∈𝑈𝑖 𝑖=1
La media poblacional
𝑁𝑖 𝑁𝑖
𝑘∈𝑈 𝑦𝑘 1 1
𝑦𝑈 = = 𝑦𝑘 = 𝑁𝑖 𝑦𝑖
𝑁 𝑁 𝑁
𝑖=1 𝑘∈𝑈𝑖 𝑖=1
1
Donde 𝑦𝑖 = 𝑘∈𝑈𝑖 𝑦𝑖
𝑁𝑖
Esquema general del Diseño
• Seleccionar una muestra probabilística 𝑠𝑖 de conglomerados de la población 𝑈𝑖
mediante un diseño de muestreo tal que entonces
𝑃(𝑆𝑖 = 𝑠𝑖 ) = 𝑝𝑖 𝑠𝑖 , ∀𝑠𝑖 ∈ 𝑄𝑖
donde 𝑄𝑖 es el soporte conteniendo todas las posibles muestras de conglomerados.
• Todos y cada uno de los elementos pertenecientes a los conglomerados seleccionados
son observados y medidos.
• Con reemplazo: si todas las posibles muestras en 𝑄𝑖 son con reemplazo. Por ejemplo
MAS
• De tamaño fijo: si todas las posibles muestras en 𝑄 tienen el mismo tamaño de muestra
𝑛(𝑆𝑖 ) = 𝑛𝑖 .
Muestreo de Conglomerados
Definición: La probabilidad de inclusión del conglomerado i-esimo está dado por:
• Para cada conglomerado de la población 𝑈𝐼 , existen números positivos 𝑝𝐼𝑖 , … , 𝑝𝐼𝑁𝑖 tales
que
𝑝𝐼𝑖 = 1
𝑈𝐼
Estas probabilidades no son necesariamente iguales.
El estimador de Hansen-Hurwitz
respectivamente. Nótese que 𝑡𝑦𝑝 es insesgado para 𝑡𝑦 y que 𝑉𝑎𝑟(𝑡𝑦𝑝 ) es insesgado para
𝑉𝑎𝑟(𝑡𝑦𝑝 )
El estimador de Hansen-Hurwitz
Definición: De manera general, un diseño de muestreo con reemplazo de conglomerados
se define como
Muestreo de Conglomerados
Al respecto de la construcción del estimador de H-Thompson bajo muestreo en
conglomerados, Bautista (1998) deduce que
𝑡𝑦𝑖
1. La eficiencia de la estrategia de muestreo toma su máximo valor cuando los valores
𝜋𝐼𝑖
son constantes para todo 𝑖 = 1, … , 𝑁𝐼
2. Cuando el diseño por conglomerados es tal que asigna probabilidades de inclusión
idénticas a cada conglomerado, la estrategia pierde eficiencia, a menos que el
comportamiento de los totales de cada conglomerado sea similar.
Esto nos llevan a preferir diseños de muestreo que asignen probabilidades de inclusión
proporcionales al tamaño del conglomerado. Para esto se debería disponer de información
auxiliar continua disponible para toda la población 𝑈𝐼 que estuviera bien correlacionada con
los totales de la característica de interés en cada conglomerado 𝑡𝑦𝑖 . Luego, si 𝑥 representa
la información auxiliar continua y 𝑡𝑥𝑖 el total de la información auxiliar en el i-ésimo
conglomerado, la correlación entre 𝑡𝑥𝑖 y 𝑡𝑦𝑖 deberıa ser bastante fuerte y las probabilidades
de inclusión de los conglomerados deberían corresponder a la siguiente forma funcional:
𝑡𝑥𝑖
𝜋𝐼𝑖 = 𝑛𝐼
𝑡𝑥