Está en la página 1de 12

Teoría y Técnicas de Muestreo

Estimadores Lineales, Estimador HT

Mg. A. Gustavo Tolaba


agustavotolaba@gmail.com
Departamento de Matemática
Facultad de Ciencias Exactas
Universidad Nacional de Salta
Estimadores lineales
Al analizar la forma de los estimadores puntuales óptimos 𝑇 = 𝑇(𝑦1 , … , 𝑦𝑛 ) las mejores propiedades
suelen estar presentes en los estimadores lineales insesgados de la forma 𝑇 = 𝑛𝑖=1 𝑤𝑖 𝑦𝑖 . Los
valores 𝑤𝑖 se denominan pesos.

Para el parámetro poblacional 𝑡𝑦 = 𝑘∈𝑈 𝑦𝑘 puede estimarse convenientemente mediante el


estimador 𝑡 = 𝑘∈𝑈 𝑤𝑘 𝑦𝑘 ya que preserva las siguientes características:

• Todas las mediciones de la variable en estudio sobre las unidades de la muestra intervienen en
la formación del estimador.
• La importancia de la aportación al estimador de la unidad muestral 𝑦𝑖 puede controlarse
mediante el coeficiente de ponderación 𝑤𝑖 o factor de elevación.
• Cuando 𝑤𝑖 = 1, todas las unidades muestrales intervienen de igual forma en la formación del
estimador.
• Los coeficientes 𝑤𝑖 pueden depender, entre otros factores, del tamaño de las unidades
muestrales (cuando son compuestas), del orden de colocación de las mismas en la muestra, y
sobre todo de la probabilidad que tiene la unidad 𝑦𝑖 de pertenecer a la muestra según el método
de muestreo considerado.
• Las funciones lineales son las más sencillas de manejar matemáticamente
El estimador de Horvitz-Thompson (HT)
Narain (1951) descubrió este estimador, aunque que fue editado y publicado por una
revista india de poca rotación. Más adelante Horvitz & Thompson (1952) publicaron
similares resultados en la revista más importante de estadística en ese tiempo, JASA
(Journal of the American Statistical Society). Desde entonces, este estimador se conoce
como el estimador de Horvitz-Thompson o estimador 𝜋, aunque rigurosamente debería ser
llamado estimador de Narain-Horvitz-Thompson

Definición: Para un universo 𝑈, se quiere estimar el total poblacional 𝑡𝑦 de la característica


de interés 𝑦 . Se define el estimador de Horvitz-Thompson(HT) para 𝑡𝑦 como:
𝑦𝑘
𝑡𝑦,𝜋 = = 𝑑𝑘 𝑦𝑘
𝜋𝑘
𝑆 𝑆
Donde 𝜋𝑘 , es la probabilidad de inclusión para el 𝑘-ésimo elemento, y 𝑑𝑘 es conocido como
factor de expansión. El estimador de HT es aleatorio porque está construido con base en
una suma sobre la muestra aleatoria 𝑆
El estimador de Horvitz-Thompson (HT)
Proposición: Si todas las probabilidades de inclusión de primer orden son mayores a cero
( 𝜋𝑘 > 0 para todo 𝑘 ), el estimador de Horvitz-Thompson es insesgado para el total
poblacional. Por tanto, se tiene que
𝐸 𝑡𝑦,𝜋 = 𝑡𝑦

Pruebas.
𝑦𝑘
Reescribiendo el estimador de Horvitz-Thompson como 𝑡𝑦,𝜋 = 𝑆 𝐼𝑘 (𝑆) 𝜋𝑘
𝑦𝑘 𝑦𝑘 𝑦𝑘
𝐸 𝑡𝑦,𝜋 = 𝐸 𝐼𝑘 𝑆 = 𝐸 𝐼𝑘 𝑆 = 𝜋𝑘 = 𝑡𝑦
𝑆 𝜋𝑘 𝑆 𝜋𝑘 𝑆 𝜋𝑘
• Si el diseño de muestreo es tal que las probabilidades de inclusión de primer orden
conservan una buena correlación positiva con la medición de la característica de
interés; en otras palabras, si 𝜋𝑘 ∝ 𝑦𝑘 , el estimador de HT es una constante, por lo tanto
tendrá varianza nula.
• En la práctica, una estrategia de muestreo optima es aquella que utiliza el estimador de
HT junto con un diseño de muestreo que induzca una buena correlación entre el vector
de probabilidades de inclusión y el vector de valores de la característica de interés.
Varianza del estimador de Horvitz-Thompson
Proposición: La varianza del estimador de Horvitz-Thompson está dada por la siguiente
expresión
𝑦𝑘 𝑦𝑙
𝑉𝑎𝑟1 𝑡𝑦,𝜋 = ∆𝑘𝑙
𝜋𝑘 𝜋𝑙
𝑈

Sen y Yates & Grundy (1953) dedujeron el siguiente resultado cuando el diseño de
muestreo es de tamaño fijo.
Proposición: Si el diseño 𝑝(·) es de tamaño de muestra fijo, entonces, la varianza del
estimador de HT se escribe como
2
1 𝑦𝑘 𝑦𝑙
𝑉𝑎𝑟2 𝑡𝑦,𝜋 = − ∆𝑘𝑙 −
2 𝜋𝑘 𝜋𝑙
𝑈
Estimación de la Varianza
Es posible construir dos estimadores insesgados para las varianzas. Para esto, se requiere
que todas las probabilidades de inclusión de segundo orden sean estrictamente positivas
(𝜋𝑘𝑙 > 0 para todo 𝑘).

∆𝑘𝑙 𝑦𝑘 𝑦𝑙
𝑉𝑎𝑟1 𝑡𝑦,𝜋 =
𝜋𝑘𝑙 𝜋𝑘 𝜋𝑙
𝑆

2
1 ∆𝑘𝑙 𝑦𝑘 𝑦𝑙
𝑉𝑎𝑟2 𝑡𝑦,𝜋 =− −
2 𝜋𝑘𝑙 𝜋𝑘 𝜋𝑙
𝑆
Estimación de la Varianza
Bautista (1998) resalta tres comentarios importantes acerca de las estimaciones arrojadas
por anteriores expresiones.
• Si (𝜋𝑘𝑙 > 0 para todo 𝑘) de la muestra, pero no para los restantes elementos, no se
puede garantizar el insesgamiento de las anteriores expresiones.
• Es posible que las estimaciones de la varianza arrojen resultados negativos. Para evitar
esta situación, es necesario que la Cov entre las estadísticas de inclusión para cada par
de elementos en la población sea negativa (∆𝑘𝑙 < 0, ∀ 𝑘 ≠ 𝑙 ).
• No necesariamente las estimaciones arrojadas por las anteriores expresiones coinciden
en todos los casos.

Por su parte, Tillé (2006) agrega que en la practica, la utilización de las expresiones de los
estimadores de la varianza es muy difícil de implementar pues la doble suma hace que el
proceso de cálculo computacional sea muy largo e ineficiente. Por lo tanto, para cada
diseño de muestreo que se utilice, se deben crear expresiones que pueden ser
simplificadas o en algunos casos se deben utilizar aproximaciones.
Intervalo de confianza para el estimador de Horvitz-Thompson
Hájek (1960) demuestra la convergencia asintótica del estimador de HT a una distribución
normal y se puede construir un intervalo de confianza de nivel (1 − 𝛼) para el total
poblacional 𝑡𝑦 de acuerdo con:

En la practica muy pocas veces se conoce la varianza del estimador; por lo tanto, el
intervalo de confianza estimado de nivel (1 − 𝛼) puede ser obtenido con los datos de la
muestra seleccionada la varianza del estimador por su correspondiente estimación y
tomaría la siguiente expresión
Intervalo de confianza para el estimador de Horvitz-Thompson
Al utilizar una estrategia de muestreo en la estimación de un parámetro en poblaciones
finitas, las propiedades de la estrategia se estudian en términos de:

• Confiabilidad: definida como la suma de las probabilidades de las muestras cuyo


intervalo de confianza contiene al parámetro.
• Precisión: definida como la longitud del intervalo de confianza.

Las propiedades están en función del intervalo de confianza.


• Para la confiabilidad se debe conocer al parámetro 𝑇 (desconocido) luego, en términos
prácticos la confiabilidad no se puede calcular.
• Para la precisión y la confiabilidad se requiere conocer la varianza, basada en el
diseño de muestreo, del estimador utilizado, 𝑇 , el cálculo de esta varianza 𝑉𝑎𝑟(𝑇 )
implica, casi siempre, el requerimiento de conocer los valores 𝑦𝑘 para todo 𝑘 = 1, … , 𝑁.
Luego la precisión tampoco se puede calcular.
• se debe proponer un estimador de 𝑉𝑎𝑟(𝑇 ) (ojalá insesgado) que junto con 𝑇 ,
proporciona una cota para el sesgo y para la precisión.
Estimación de otros parámetros
Estudiamos un estimador del total poblacional de la característica de interés, y ésta se
puede utilizar para estimar otras cantidades poblacionales de interés. Si el tamaño
poblacional 𝑁 es conocido, la media poblacional puede ser estimada con el estimador de
Horvitz-Thompson

La media poblacional es estimada insesgadamente mediante el uso de la siguiente


expresión
1 1 𝑦𝑘
𝑦𝑘 = 𝑡𝑦,𝜋 =
𝑁 𝑁 𝜋𝑘
𝑆

La varianza y la varianza estimada del estimador de la media poblacional estan


dadas por
1
𝑉𝑎𝑟 𝑦𝑘 = 2 𝑉𝑎𝑟 𝑡𝑦,𝜋
𝑁
1
𝑉𝑎𝑟 𝑦𝑘 = 2 𝑉𝑎𝑟 𝑡𝑦,𝜋
𝑁
Estimación de otros parámetros
Podemos usar el estimador de HT para estimar 𝑁 que puede ser escrito de la siguiente
manera
𝑁= 1
𝑈

El tamaño poblacional es estimado insesgadamente mediante el uso de la siguiente


expresión:
1
𝑁𝜋 =
𝑈 𝜋𝑘

Tillé (2006) cita que aun al conocer 𝑁, una mala propiedad del estimador de HT para la
media poblacional se tiene al utilizarlo cuando la característica de interés es constante
para todos los elementos de la población
Estimadores de muestreo

Bautista (1998) afirma que en aquellos casos en los que se conoce el valor de 𝑁 es
preferible ignorarlo y utilizar el estimador 𝑦𝑆 puesto que su variación es menor y cuando
𝑦𝑘 = 𝐶 ∀ 𝑘 ∈ 𝑈 reproduce la media poblacional con varianza Nula

Cuando el tamaño poblacional es conocido y, para algunos diseños de muestreo sin


reemplazo, se puede crear un nuevo estimador alternativo del total poblacional

También podría gustarte