Documentos de Académico
Documentos de Profesional
Documentos de Cultura
• Todas las mediciones de la variable en estudio sobre las unidades de la muestra intervienen en
la formación del estimador.
• La importancia de la aportación al estimador de la unidad muestral 𝑦𝑖 puede controlarse
mediante el coeficiente de ponderación 𝑤𝑖 o factor de elevación.
• Cuando 𝑤𝑖 = 1, todas las unidades muestrales intervienen de igual forma en la formación del
estimador.
• Los coeficientes 𝑤𝑖 pueden depender, entre otros factores, del tamaño de las unidades
muestrales (cuando son compuestas), del orden de colocación de las mismas en la muestra, y
sobre todo de la probabilidad que tiene la unidad 𝑦𝑖 de pertenecer a la muestra según el método
de muestreo considerado.
• Las funciones lineales son las más sencillas de manejar matemáticamente
El estimador de Horvitz-Thompson (HT)
Narain (1951) descubrió este estimador, aunque que fue editado y publicado por una
revista india de poca rotación. Más adelante Horvitz & Thompson (1952) publicaron
similares resultados en la revista más importante de estadística en ese tiempo, JASA
(Journal of the American Statistical Society). Desde entonces, este estimador se conoce
como el estimador de Horvitz-Thompson o estimador 𝜋, aunque rigurosamente debería ser
llamado estimador de Narain-Horvitz-Thompson
Pruebas.
𝑦𝑘
Reescribiendo el estimador de Horvitz-Thompson como 𝑡𝑦,𝜋 = 𝑆 𝐼𝑘 (𝑆) 𝜋𝑘
𝑦𝑘 𝑦𝑘 𝑦𝑘
𝐸 𝑡𝑦,𝜋 = 𝐸 𝐼𝑘 𝑆 = 𝐸 𝐼𝑘 𝑆 = 𝜋𝑘 = 𝑡𝑦
𝑆 𝜋𝑘 𝑆 𝜋𝑘 𝑆 𝜋𝑘
• Si el diseño de muestreo es tal que las probabilidades de inclusión de primer orden
conservan una buena correlación positiva con la medición de la característica de
interés; en otras palabras, si 𝜋𝑘 ∝ 𝑦𝑘 , el estimador de HT es una constante, por lo tanto
tendrá varianza nula.
• En la práctica, una estrategia de muestreo optima es aquella que utiliza el estimador de
HT junto con un diseño de muestreo que induzca una buena correlación entre el vector
de probabilidades de inclusión y el vector de valores de la característica de interés.
Varianza del estimador de Horvitz-Thompson
Proposición: La varianza del estimador de Horvitz-Thompson está dada por la siguiente
expresión
𝑦𝑘 𝑦𝑙
𝑉𝑎𝑟1 𝑡𝑦,𝜋 = ∆𝑘𝑙
𝜋𝑘 𝜋𝑙
𝑈
Sen y Yates & Grundy (1953) dedujeron el siguiente resultado cuando el diseño de
muestreo es de tamaño fijo.
Proposición: Si el diseño 𝑝(·) es de tamaño de muestra fijo, entonces, la varianza del
estimador de HT se escribe como
2
1 𝑦𝑘 𝑦𝑙
𝑉𝑎𝑟2 𝑡𝑦,𝜋 = − ∆𝑘𝑙 −
2 𝜋𝑘 𝜋𝑙
𝑈
Estimación de la Varianza
Es posible construir dos estimadores insesgados para las varianzas. Para esto, se requiere
que todas las probabilidades de inclusión de segundo orden sean estrictamente positivas
(𝜋𝑘𝑙 > 0 para todo 𝑘).
∆𝑘𝑙 𝑦𝑘 𝑦𝑙
𝑉𝑎𝑟1 𝑡𝑦,𝜋 =
𝜋𝑘𝑙 𝜋𝑘 𝜋𝑙
𝑆
2
1 ∆𝑘𝑙 𝑦𝑘 𝑦𝑙
𝑉𝑎𝑟2 𝑡𝑦,𝜋 =− −
2 𝜋𝑘𝑙 𝜋𝑘 𝜋𝑙
𝑆
Estimación de la Varianza
Bautista (1998) resalta tres comentarios importantes acerca de las estimaciones arrojadas
por anteriores expresiones.
• Si (𝜋𝑘𝑙 > 0 para todo 𝑘) de la muestra, pero no para los restantes elementos, no se
puede garantizar el insesgamiento de las anteriores expresiones.
• Es posible que las estimaciones de la varianza arrojen resultados negativos. Para evitar
esta situación, es necesario que la Cov entre las estadísticas de inclusión para cada par
de elementos en la población sea negativa (∆𝑘𝑙 < 0, ∀ 𝑘 ≠ 𝑙 ).
• No necesariamente las estimaciones arrojadas por las anteriores expresiones coinciden
en todos los casos.
Por su parte, Tillé (2006) agrega que en la practica, la utilización de las expresiones de los
estimadores de la varianza es muy difícil de implementar pues la doble suma hace que el
proceso de cálculo computacional sea muy largo e ineficiente. Por lo tanto, para cada
diseño de muestreo que se utilice, se deben crear expresiones que pueden ser
simplificadas o en algunos casos se deben utilizar aproximaciones.
Intervalo de confianza para el estimador de Horvitz-Thompson
Hájek (1960) demuestra la convergencia asintótica del estimador de HT a una distribución
normal y se puede construir un intervalo de confianza de nivel (1 − 𝛼) para el total
poblacional 𝑡𝑦 de acuerdo con:
En la practica muy pocas veces se conoce la varianza del estimador; por lo tanto, el
intervalo de confianza estimado de nivel (1 − 𝛼) puede ser obtenido con los datos de la
muestra seleccionada la varianza del estimador por su correspondiente estimación y
tomaría la siguiente expresión
Intervalo de confianza para el estimador de Horvitz-Thompson
Al utilizar una estrategia de muestreo en la estimación de un parámetro en poblaciones
finitas, las propiedades de la estrategia se estudian en términos de:
Tillé (2006) cita que aun al conocer 𝑁, una mala propiedad del estimador de HT para la
media poblacional se tiene al utilizarlo cuando la característica de interés es constante
para todos los elementos de la población
Estimadores de muestreo
Bautista (1998) afirma que en aquellos casos en los que se conoce el valor de 𝑁 es
preferible ignorarlo y utilizar el estimador 𝑦𝑆 puesto que su variación es menor y cuando
𝑦𝑘 = 𝐶 ∀ 𝑘 ∈ 𝑈 reproduce la media poblacional con varianza Nula